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Предисловие 


В настоящее время значительно усилился интерес 
к звуковой речи как акустическому продукту коммуни- 
кационного поведения человека. Будучи по своей приро- 
де уникальным психофизиологическим актом, присущим 
только человеку, речь как по своему порождению, так 
и по восприятию опирается на материальную основу 
физических принципов генерации звука и биофизических 
механизмов его рецепции. Уникальность речевой функ- 
ции заключается прежде всего в ее непосредственной 
связи с мышлением, с информацией, содержащейся 
в Памяти человека, а также в мощности управляющих 
влияний и тонкости регуляционных механизмов, кото- 
рые обеспечивают образование и восприятие речи, т. е. 
процесс коммуникации. 

Изучение речи в плане коммуникационных феноме- 
нов, способных обеспечить обмен информацией между 
людьми, представляет интерес не только с точки зрения 
познания фундаментальных законов природы самого 
человека в проявлениях его высших интеллектуальных 
функций. Начиная с середины 70-х годов ХХ ст. изу- 
чение речи стало необходимым элементом прогресса 
в коммуникации человека с ЭВМ, вызванного все рас- 
ширяющимся внедрением компьютерной техники во 
многие сферы деятельности современного общества. За- 
манчивая идея общения человека с машиной с по- 
мощью звуковой речи не может быть решена, однако, 
без всестороннего изучения речи во всех ее естествен- 
но-научных и социально-лингвистических аспектах. 
Ознакомление со спектрально-временной динамикой ре- 
чевых сигналов является необходимым этапом такого 
изучения. 

В настоящей книге приводится обширный материал 
динамических спектрограмм русской речи. Это динами- 
ческие спектры симметричных и несимметричных сло- 
гов, слов, слитно произнесенных фраз. Ознакомившись 
с основными положениями акустической теории речеоб- 
разования, читатель сможет усвоить метод нахождения 
на динамических спектрах речи основных артикуляци- 
онных признаков речеобразования, лежащих в основе 
фонетической классификации звуков речи. 


Динамическая спектрография — превосходный метод 
исследования, широко используемый в современной аку- 
стике речи, биофизике и психофизиологии речевого во- 
сприятия, в экспериментальной фонетике. Он замечателен 
прежде всего тем, что информация, отображаемая им, 
в своей основе адекватна слуховому анализу. В плане 
акустико-фонетического анализа динамических спектро- 
грамм очень важно то, что в них отображены фонемо- 
образующие артнкуляцнонные жесты, порождающие 
звуковую речь: смыкание—размыкание переднего конца 
речевого тракта (губ или зубов), движенне вперед— 
назад, вверх—вниз тела и кончика языка, сужение— 
расширение гортанной трубки, прижатие языка к верх- 
нему небу, открытие—закрытие носового хода и др. Все 
эти фонетические движения исполняются с неодинако- 
вой четкостью, а следовательно, и проявляются с раз- 
личной выразительностью на динамических спектро- 
граммах изолированных слогов, слов или слитных фраз. 
В силу этого анализ динамических спектрограмм естест- 
венной речи не является легко осуществимой задачей, 
а требует. привлечения многих априорных сведений 
о природе языка. 

Каждый звук речи имеет свой спектр. Следователь- 
но, все разнообразие звуков — это, в сущности, разно- 
образие их спектров. Наиболее существенно в этом 
плане то, что звуки способны выполнять смыслоразли- 
чительную функцию, т.е. выступать в качестве пред- 
ставителей фонем данного языка. Фонемная функция 
звуков речи способна проявиться, однако, только в си- 
стеме использования языка, в тех неразрывных связях, 
в которых живая акустическая речь соотносится с язы- 
ком как историко-социальной лингвистической катего- 
рией. Благодаря активному использованию знаний язы- 
ка осуществляется трансформация физически непрерыв- 
ной во времени речевой волны в упорядоченную цепоч- 
ку дискретных во времени единиц — фонем, обеспечи- 
вающих (реально или потенциально) функцию осмыс- 
ленного восприятия естественной речи. 

В настоящее время широко распространено мнение, 
что связь между акустикой речевого сигкала и его смы- 
словой интерпретацией осуществляется целенаправлен- 
ными преобразованиями речевой волны, активно исполь- 
зующими содержащуюся в памяти информацию, в про- 
цессе которых происходит выделение акустических кор- 
релятов наиболее значимых фонетических признаков, 
отображающих фонемообразующие артикуляционные 
жесты. Вследствие этого и становится возможной фо- 
немная категоризация звуков в речевом потоке при их 
восприятии. 


4 


Каждый, кто занимался динамической спектрогра- 
фией речи, переживал трудно преодолимый соблазн 
чтения динамических спектрограмм наподобие того, как 
мы читаем письменную речь. В предлагаемой книге мы 
попытаемся дать читателю возможность наиболее полно 
осуществить такое желание на практике. В ‚этом — одна 
из задач настоящей монографии. нй . 

Однако главная цель книги — ознакомить читателя 
с разнообразием звуковых реализаций фонем, русского 
языка в зависимости от сложности структуры тех вы- 
сказываний, в которых они выступают, начиная с изо- 
лированных слогов и йростых слов и кончая слитными 
фразами. Особое внимаиие уделено динамике. поведения 
формант, а также других четко выделенных акусти- 
ческих явлений в спектре речевых сигналов. Вместе 
с читателем мы будем визуально следить за этими фо- 
нетически информативными характеристиками на дина- 
мических спектрограммах и обнаруживать принципналь- 
но важные их изменения, способствующие фонемной 
категоризации речевого потока. 

Наконец, мы попытаемся подвести читателя к мысли 
о том, что не только одна спектральная динамика ре- 
чевого сигнала несет сведения о воспринимаемом сооб- 
щении. Для осуществления осмысленного восприятия 
речи необходимо или априорное знакие контекста, или 
активная сообразительность, основанная на знаниях 
законов языка и конкретной коммуникационной ситуа- 
ЦИИ. 

Книга предназначена также для тех исследователей, 
которые ставят своей задачей осуществить машинное, 
автоматическое распознавание речи и такой же ее син- 
тез. Эти проблемы все более остро встают перед тео- 
рией и практикой автоматического управления. Отсут- 
ствие строго документированного и упорядоченного, 
богатого фактическим материалом руководства по ди- 
намическим спектрам звуков русской речи отрицатель- 
но сказывается на проводимых в этом направлении 
работах. Материал, представленный в книге, должен 
отчасти заполнить образовавшийся пробел. Одновремен- 
но он не претендует на то, чтобы быть образцом со- 
временного русского литературного стиля произноше- 
ния. Слоги, слова и фразы, динамические спектрограммы 
которых рассматриваются в книге, произносились не про- 
фессиональными дикторами, а лицами, естественно поль- 
зующимися русской речью. Книга, надеемся, станет по- 
лезным руководством для широкого круга лингвистов, 
в первую очередь фонетистов, изучающих природу речи, 
а также биофизиков, физиологов и психологов — спе- 
циалистов и студентов. 


Авторы выражают благодариость профессору Ин- 
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ческих наук В. А. Кожевникову, научным сотрудникам 
Э. И. Столяровой, Н. А. Слепокуровой, Л. И. Чуйкиной 
(Инстнтут физиологии им. И. П. Павлова), кандидату 
филологических наук Н. Д. Светозаровой (Ленииград- 
ский университет), Н. В. Зиновьевой (Московский уни- 
верситет), профессору Королевского технологического 
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спектрограмм речевых сигналов, А. де Серпа Лейта (Ко- 
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Львовского университета А. А. Битар, Г. Н. Вандаку- 
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ГЛАВА | 


ОБЩИЕ ПРИНЦИПЫ 
ОБРАЗОВАНИЯ ЗВУКОВ РЕЧИ 
И МЕТОДЫ ИЗУЧЕНИЯ ИХ АКУСТИЧЕСКИХ СВОЙСТВ 


1.1. МЕХАНИЗМЫ ОБРАЗОВАНИЯ ЗВУКОВ РЕЧИ 


Речеобразование — это строго скоординированный поведен- 
ческий акт, состоящий из многочисленных жестов артикулятор- 
ных органов, посредством которого реализуется важиейший 
механизм обмена информацией между людьми. 

На рис. 1.1.1. показана схема речеобразующего аппарата че- 
ловека [3]. Формирование звуков речи осуществляется с участи- 
ем трех основных полостей: рта, носа и глотки. Полость рта 
сзади соединяется с полостью глотки, их границей можно считать 
надгортанье. Снизу полость рта ограничена языком, спереди и с 
боков — зубными дугами, а сверху — небом. Передняя часть неба 
называется твердым небом (раіаќит), а задняя — иебной зана- 
вескоћ, или мягким небом (уеит). 

Полость глотки размещена над и за гортанью. В нее непо- 
средственно проходит воздух из легких через трахею. Верхняя 
полость глотки, или носоглотка, границей которой считают мягкое 
небо, соединяется в передне-верхней части с носовой полостью. 
Носоглотка и носовая полость образуют вспомогательный тракт, 
который начинается у иебной занавески и заканчивается ноздрями. 
Акустическая связь между ротовой и носовой полостями опреде- 
ляется размерами канала, через который проходит воздух в носо- 
глотку. Вследствие этого назализация может не ограничиваться 
только носовыми согласными, но распространяться и на другие, 
в частности, гласные звуки речи. 

Гортань, которой сверху заканчивается трахея, представляет 
собой хрящевое образование. Она имеет складки мышечной и со- 
единительной ткани, управляющие просветом голосовой щели — 
так называемые голосовые связки. Вибрация голосовых связок 
приводит к образованию вокализованных звуков речи. 

Собственно речевой тракт — это соединенные полости рта и 
глотки, представляющие собой в сущности трубу неодинакового 
и постоянно изменяющегося сечения, которая начинается у голо- 
совых связок и заканчивается губами. К ней, в случае надобности, 
дополиительно подключаются иосоглотка и носовые полости. 

Речь образуется вследствие непрерывно управляемого движе- 
ния органов речевого аппарата. Каждому звуку речи соответству- 
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Рис. 1.1.1. Схема речеобразующего аппарата 
человека [3]. 


1 — полость рта; 2— твердое небо: 3 — мягкое 

небо (небная занавеска); 4 — носоглотка; 5 — 

язык; 6 — полость носа; 7 — полость глотки; 8 — 

надгортанье; 9 — пнщевод; /0 — голосовые связкн 

гортани; // — голосовая щель; /2 — трахея; /3— 
бронхи. 


ет либо определенное статическое положение, либо определенная 
динамика изменения артикуляционных органов — голосовых 
связок языка, челюстей, губ, небной занавески, т. е. каждому звуку 
речи соответствует определенная артикуляция [33, 34]. 
Формироваиие звуков речи может происходить с участием 
голоса или включать неголосовые, в частности импульсный и тур- 
булентный, механизмы возбуждения шума. Образование голоса, 
или фонации связано с работой голосовых связок, которые наряду 
с легкими и мышцами грудной клетки образуют голосовой источ- 
ник. Его основным свойством является периодичность создавае- 
мого звука, так как периодические колебания голосовых связок 
вызывают периодические изменения просвета голосовой щели 
и модуляцию потока выдыхаемого воздуха (рис. 1.1.2). Отрезок 
времени Тъ, необходимый для полного цикла колебания голосовых 
связок (от начала размыкания в предыдущем цикле до начала 
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Рис. 1.1.2. Характеристика ра- 
боты голосового источника [34]: 


А — схематическое изображение 

фронтального сечення гортани в 

областн голосовых связок, движе- 

ния которых показаны горизонталь- 

нымн стрелками; стрелки внизу по- 

казывают напор воздуха. Б — ти- 

пичная форма нзмененин скорости Ё 
воздушного потока, возинкающих ж} {= 
благодаря дейстаню колеблющихся 

голосовых связок; по оси абсцисс— 

время, по осн ординат — объемная 

скорость, В — спектр колебаннй, М 





осцнллоғрамму которых изобража- 
ет схема Б; по осн абсцисс — ча- -50 ћ 
стота колебаинй, по осн ординат — 0 1000 
интенсивность; интервалы между 
гармониками показывают частоту 

основного тона. а в 
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размыкания в последующем), называется периодом колебаний 
голосовых связок и определяет так называемую основную частоту 
голоса Ё, 


Рот =. (1.1.1) 


В речевом процессе основная частота голоса непрерывно, про- 
извольно или непроизвольно, изменяется, вызывая соответствую- 
щие изменения интонации и эмоциональной окраски произноснмой 
фразы. 

Важной характеристикой голосового источника является фор- 
ма кривой изменения объемной скорости потока воздуха над 
голосовой щелью. Она имеет вид несколько округленного пило- 
образного колебания с быстрым иарастанием и более медленным 
спаданием скорости потока (рис. 1.1.2, Б). Эта форма кривой 
определяет спектр голосового источника, показанный на схеме 
(рис. 1.1.2, В}. Следует отметить его гармонический характер, 
так как все спектральные составляющие периодического колеба- 
ния представляют собой гармоники основной частоты голоса Ро. 
Частота основного тона определяет частотный интервал следо- 
вания спектральных составляющих, которые характеризуются 
падением интенсивности в сторону высоких частот порядка 6 дБ 
на октаву. 

Невокализованные звуки речи образуются с помощью двух 
типов источников акустического возбуждекия. Первый — это тур- 
булентный шум, возникающий при завихрении воздущной струи 
в том месте речевого тракта, где с помощью артикуляционных 
органов создано наибольшее сужение. Спектр шумового источника 
характеризуется отсутствием дискретных гармонических состав- 
ляющих, он сплошной и, как правило, достаточно широкополос- 
ный. В связи с различной локализацией и конфигурацией места 
сужения разные щелевые согласные имеют неодинаковые частот- 
ные диапазоны шума. Весьма изменчива интенсивность шума 
у различных согласных. 
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Рис. 1.1.3. Характеристики ра- 
боты шумовых источников 
[3, 28]: 

А — протеканне воздушной струн 
через сужение в речевой трубке; 
Б — шумовой сигнал, возникающий 
благодаря явлению турбулентнос- 
ти; В — широкополосный спектр 
шумового сигнала; Г — образова- 
ние воздушного толчка прн откры- 
вании сомкнутых артикуляторов, 
за которыми создано дополнитель- 
исе давленне; Д — нмпульсный 





ё 
Т 
сигнал, возникающий в момент от- 
крывания смычки артикуляторов; 
Е — спектр импульсного снгнала. 
Стрелки на схемах А и Б харак- 
г Т теризуют движение воздушиых по- 
токов. По осях координат / — ин- 
8 е тенснвность, 1 — время, ј — частота. 


Второй тип неголосового источника — импульсный. Суть его 
заключается в скачкообразном выравнивании внутриротового 
и атмосферного давления, которое возиикает в том или ином 
месте речевого тракта при резком раскрытии смычки артикуля- 
ционных органов. Источник такого взрывообразного звука лока- 
лизуется в месте смычки, вследствие чего образуются губные, 
зубные и небные взрывные согласные. Характеристика работы 
шумовых источников приведена на рис. 1.1.3. 

Формирование целого ряда звуков речи обусловлено одновре- 
менным действием двух источников сразу, например, голосового 
и шумового, голосового и импульсного и т. п. 


1.2. ЭЛЕМЕНТЫ АКУСТИЧЕСКОЙ ТЕОРИМ РЕЧЕОБРАЗОВАНИЯ 


С точки зрения акустики речевой сигнал Р(ј) представляет 
собой произведение передаточной функции речевого тракта Т({) 
на спектр источника $ ({) [28, 29]: 


РР =5$ (Ф-Т. (1.2.1) 


Передаточная функция речевого тракта представляет собой 
систему резонансов и антирезонансов, обусловленную артикуля- 
торной конфигурацией речевого тракта в каждый даниый момент 
времени. В силу этого образование в процессе речевой деятель- 
ности тех или иных звуков речи сводится, в сущности, к процессу 
частичной фильтрации сигиала, генерируемого источииком. 

Рассмотрим рис. 1.2.1, на котором изображено образование 
гласного звука, близкого по спектру к звуку а. На верхией левой 
части рисунка видно, как гортань генерирует акустические им- 
пульсы с интервалами между соседними импульсами, равными То. 
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Рис. 1.2.1. Схема образоваиия вокализоваииых звуков речи как резуль: 
тата передачи спектра источиика через фильтровую систему [29]. Пе- 
риодическая зависимость от времени изменений воздушного потока 
через голосовую щель с периодом То преобразуется в спектр гармоник 
5(}), который после умножения иа характеристику передаточиой функ- 
ции Г({) дает спектр Р(ў) произиосимого гласиого. Этот же звук может 
быть представлеи и как фуикция времеии (осциллограмма), которая 
показана вверху справа. 


Будем считать, что имеем дело со стационарным звуком, произ- 
несенным протяжно, и с установившимися во времени акусти- 
ческими характеристиками. Такой стационарный периодический 
сигнал в частотном представлении имеет гармонический спектр 
(левая нижняя часть рисунка). Он характеризуется частотой ос- 
новного тона Ро, причем исходный спектр импульсов гортани имеет 
наклонную форму, где амплитуда каждой следующей гармоники 
уменьшается примерно на 6 дБ на октаву. 

Передаточная функция речевого тракта Т({) показана посре- 
дине нижней части рисунка, которая воспроизводит характеристи- 
ку фильтрующей системы, соответствующую произнесению глас- 
ного звука а. Процесс частотной фильтрации состоит в том, что 
амплитуда каждой из гармоник источника $ (Г) на соответствую- 
щей частоте | умножается на значение передаточной функции 
тракта Т({) на этой частоте, как это показано в правой нижней 
части рисунка. 

Как известно, интенсивность [ и амплитуду А акустического 
сигнала принято выражать в логарифмическом масштабе, поль- 
зуясь шкалой децибел. В таких случаях можно говорить об уров- 
не звука Г. Связь между уровнем |. звукового сигнала, его интен- 
сивностью Г и амплитудой А устанавливается соотношением: 


1.=1016 о =20 16 А/Ао. (1.2.2) 


В качестве опорной амплитуды А, обычно берется акустиче- 
ский стандарт амплитуды порога слышимости, имеющий значение 


П 


0,0002 дин/см? хотя Аб может устанавливаться исходя из конкрет- 
ных требований *. 

Путем логарифмирования выражения (1.2.1) приходим к ад- 
дитивной записи спектрального уровня звука /. (ў) на частоте } 
в децибелах: 


р =201е Р(ђ =2016 5(ђ +2016 7(ђ. (1.2.3) 


Таким образом, спектральный уровень звука на каждой дан- 
ной частоте представляет собой сумму уровня сигнала источника 
на этой частоте и передаточной функции в децибелах. 

Определение значений передаточной функции тракта Т({) на 
нужной частоте в каждый момент времени является весьма слож- 
ной задачей. Одним из первых, кто решил ее в классическом 
виде, был Г. Фант [28]. Как отметил он, передаточная функция 
тракта практически полностью определяется формой полостей, 
которую можно представить как некоторую площадь А для каж- 
дого поперечного сечения вдоль оси речевого тракта Х от голосо- 
вых связок до губ. Указанная функция площади А(Х), которая 
меняется вдоль координатной оси речевого тракта, естественно, 
зависит от положения артикуляционных органов в момент про- 
изнесения того или иного звука. Чтобы получить информацию, 
необходимую для определения передаточной функции речевого 
тракта, важно иметь методы описания площади поперечного се- 
чения А(Х) в любой точке или же в точках повышенной инфор- 
мативности на протяжении всей длины речевого тракта. Эти 
данные можно получить путем рентгенографического изучения 
речевого тракта в процессе артикуляции разных звуков, звукосо- 
четаний и слов, после чего производятся соответствующие вычис- 
ления на моделях разной степени сложности. 

Процесс получения по рентгенограмме функции площади А (Х), 
необходимой для вычислений, отображен на рис. 1.2.2 для это- 
го же гласного. Первым шагом в исследовании является тщатель- 
ная оценка формы и площади поперечных сечений речевого трак- 
та для ряда точек вдоль осевой линии. Эти точки показаны слева 
сверху на профиле артикуляции звука ы. Как указывает Г. Фант, 
определение площади производится на основе всех данных, кото- 
рые могут быть для этого использованы, включая зубные слепки 
и фронтальные рентгенограммы глотки. Эти определения дают 
отправные точки для построения функции площадей, которые по- 
казаны на рисунке справа для соответствующих точек. После 
этого находятся промежуточные значения по медиальной рентге- 
нограмме с учетом условий непрерывности. Полученная функция 
(центральная часть рисунка), наконец, преобразуется в ступен- 
чатую (нижняя часть рисунка), необходимую для проведения ко- 
личественных расчетов [28]. 


* За иитеисивиость иулевого уровия принята величина /=10-!2 Вт/м?, со- 
ответствующая звуковому давлению 2,04.10-5 Па. 
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Рис. 1.2.2. Способ получения ступеичатого приближеиия к фуикции пло- 
щади на основаиии рентгеиограмм [28]. Определяются площади для ряда 
поперечиых сечений речевого тракта, перпеидикуляриых к осевой лииии 
на протяжении от голосовой щели до губ. Эти площади показаны на 
рисуике справа, а места соответствующих разрезов — слева сверху для 
произносимого звука [ы] На основаиии этих даиных строится плавная 
кривая, представляющая собой фуикцию площади в зависимости от рас- 
стояния (средияя часть рисунка). Эта кривая разбивается на ряд сту- 
пеней для проведения количествеииых расчетов по модели речевого тракта 
(нижияя часть рисунка). 


Существенную роль в образовании и восприятии гласных 
играют максимумы передаточной функции, которые характери- 
зуют основные резонансы речевого тракта и называются форман- 
тами спектра. Они обозначаются ЁРІ, 22, ЁЗ и т.д., начиная от 
низкочастотного конца спектра. Основные резонансные полости, 
расположенные вдоль речевого тракта, накладывают на пере- 
даточную функцию Т({) ограничения, которые можно в допу- 
стимом приближении рассматривать как последовательную фор- 
мантную фильтрацию. Амплитуды и частоты формант связаны 
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функционально, что облегчает вычисление их параметров. Таким 
образом, форманты — это резонансные пики, ‚проявляющиеся 
в картине спектра и соответствующие набору собственных частот 
речевого тракта. Частоты формант обычно обозначаются Ё}, Ё», 
Ез и т.д. а ширины полос формант на уровне 3 дБ от вершины 
огибающей спектра — В+, В», Вз и т. д. Описание звуков речи при 
помощи частот их формант, как правило, не более первых двух 
или трех, дает в результате так называемую Р-картину, или Ё- 
паттерн этого звука. Формантное описание звуков речи, в частности 
гласных, является более компактным и экономичным, чем описа- 
ние в виде совокупности всех гармоник. В принципе для заданной 
Е-картины можно установить существенные параметры функции 
поперечного сечения речевого тракта. Эта связь, многократно под- 
твержденная методами синтеза речи, дает возможность рассма- 
тривать переход от Ё-картины к артикуляционным параметрам 
как ценный метод уменьшения избыточности описания речевого 
сигнала. 

Однако методы определения формант не всегда однозначны. 
Они связаны с рядом неразрешенных проблем. Прежде всего 
частота форманты может не совпадать с частотой какой-либо 
гармоники, что видно, например, в правой нижней части рис. 1.2.1. 
Это обусловливается взаимной независимостью характеристик 
источника и передаточной функции. Поэтому частота форманты 
в случае гармонического спектра практически определяется с точ- 
ностью до ошибки ЛР, которая пропорциональна Ё, и имеет по- 
рядок Ро/4 [29]. Кроме Е-картины спектральных резонансов, в ря- 
де согласных звуков, а также при назализации гласных прояв- 
ляются антирезонансы, или нули. Картина спектральных нулей, 
или 2-паттерн, значительно менее определенная, чем Р-картина 
спектральных формант. Сами по себе они не столь существенны 
для восприятия, однако наличие антирезонанса изменяет относи- 
тельные уровни соответствующих формант, образуя своеобразные 
полюсно-нулевые пары. 

Одновременно спектрально-временные характеристики турбу- 
лентных шумов и импульсных взрывов согласных не только до- 
полняют фонетическую информацию, содержащуюся в речевом 
потоке, но и существенно усложняют характер Р- и 2-картин в ди- 
намических спектрограммах речевых сигналов. Наконец, следует 
иметь в виду, что детальные механизмы выделения формант не- 
посредственно слуховым анализатором человека представляют 
собой еще не решенную задачу. Необходимо также предостеречь 
читателя от ожидания легкого успеха в визуальном выделении 
и интерпретации формант при чтении динамических спектрограмм. 
Он сможет убедиться в дальнейшем, что для решения этой задачи 
в ряде случаев необходимы априорные языковые знания. 

Тем не менее акустическая теория речеобразования представ- 
ляет собой хорошую теоретическую основу для метода нахожде- 
ния в динамических спектрах речи акустических коррелятов наи- 
более важных артикуляционных событий и жестов, свидетель- 
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ствующих о характере источника, способе и месте образования 
звуков речи. В течение последних десяти лет эта теория разви- 
валась весьма бурно, что привело к детализации многих ее клас- 
сических положений. Тех, кто желает рассмотреть более подробно 
вопросы теории частотного и временного анализа речи и их связи 
с процессом речеобразования, мы отсылаем к классическим рабо- 
там Г. Фанта и Дж. Фланагана, а также к более новым обзорам 
и руководствам [28, 29, 30, 34]. 


1.3. ДИНАМИЧЕСКАЯ СПЕКТРОГРАФИЯ РЕЧЕВОГО СИГНАЛА 


Итак, все разнообразие звуков речи так или иначе отобра- 
жается в разнообразии их спектров, характер которых постоянно 
изменяется в речевом потоке. Основу этих изменений составляют 
меняющиеся резонансы основных Ё-картин и меняющиеся доба- 
вочные полюсно-нулевые пары, возникающие из-за конкретных 
особенностей артикуляции и местоположения источника. 

Спектральное представление речевого сигнала во времени яв- 
ляется его адекватным представлением также с точки зрения 
восприятия речи человеком. Слуховая система, в частности основ- 
ная мембрана внутреннего уха, осуществляет разложение акусти- 
ческой речевой волны в спектр, передавая по слуховому нерву 
в высшие отделы центральной нервной системы информацию 
о том, как.-перераспределяется во времени энергия в речевой 
волне, включая весь диапазон слышимых человеком звуковых 
частот. Динамическая спектрография речи явилась, по единодуш- 
ному признанию специалистов, мощным и общепринятым мето- 
дом акустического анализа речи в плане ее экспериментально- 
фонетического исследования. С ее помощью получена подавля- 
ющая часть данных, составивших современные сведения о струк- 
туре речи многих языков [34]. 

Принцип метода и первая аппаратура были разработаны 
в 1946 г. Бэлловской лабораторией (США) в виде звукового 
спектрографа. Вскоре появилась его усовершенствованная моди- 
фикация — Кэйевский сонограф (рис. 1.3.1). Эта модель позволяет 
анализировать 2,4 с речи, записанной на магнитный диск. После 
записи сигнал многократно воспроизводится и на специальной 
бумаге регистрируется динамическая спектрограмма — картина, на 
которой ось времени расположена горизонтально, ось частоты — 
вертикально, а от интенсивности зависит степень потемнения бу- 
маги. В связи с наклоном спектра голосового источника около 
6 дБ на октаву, в современных сонографах имеется возможность 
вводить подъем высоких частот от 6 до 12 дБ на октаву и тем 
самым визуализировать высокочастотные компоненты спектра ре- 
чевого сигнала. 

В 1947 г. в книге Р. Поттера, Г. Коппа и Г. Грина «Видимая 
речь» были опубликованы спектрограммы звуков для английского 
и других языков [46]. С тех пор методы спектрографии получили 
широкое распространение не только в экспериментальной фонети- 
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ке, но и во многих прикладных областях исследования речевого 
сигнала, а устройства, использующие данный метод, часто стали 
называть приборами «видимой речи». 

В настоящее время приборы «видимой речи» широко приме- 
няются в различных областях речевой коммуникации, в частности 
для информативного описания речевых сигналов в задачах авто- 
матического распознавания речи отдельных дикторов. В такой 
модификации широкую популярность приобрели приборы серии 
«Воиспринт». Динамические спектрографы типа «Воиспринт» от- 
личаются от сонографов только конструктивными деталями. По- 
мимо удобного и компактного расположения функциональных 
блоков, в последних моделях этих приборов имеется возможность 
подъема высоких частот до 18 дБ на октаву, что позволяет вы- 
являть на спектрограммах значительно больше индивидуальных 
деталей, расположенных в высокочастотной области спектра. 

В наиболее распространенных современных модификациях 
приборов «видимой речи» анализируемый участок речевого си- 
гнала длительностью около 2,5 с, записанный на фиксируемом 
участке магнитной ленты, многократно воспроизводится при по- 
мощи быстро вращающейся магнитной головки с автоматической 
подачей снимаемого сигнала на вход полосового фильтра. На 
диаграмме, представляющей результаты анализа, вычерчивается 
линия, степень черноты которой отражает интенсивность выход- 
ного сигнала упомянутого фильтра. Запись производится на спе- 
циальной электрочувствительной бумаге. С каждым циклом ча- 
стота настройки фильтра сдвигается, на диаграмме вычерчивается 
новая линия, несколько сдвинутая от предыдущей. В результате 
возникает трехмерное изображение с осями: время, частота, 
интенсивность. В приборах обычно используется принцип гетеро- 
‘динного анализатора — абсолютная величина ширины полосы 
фильтра сохраняется постоянной по всей частотной шкале. Наи- 
более часто ширина полосы пропускания фильтра берется доволь- 
но большой — порядка 300 Гц. 

Общий уровень интенсивности, при котором проводится снятие 
динамической спектрограммы, устанавливается по наиболее ин- 
тенсивной. компоненте снимаемого сигнала (как правило — это 
ударные гласные) с тем, чтобы избежать перегрузки анализатора, 
а следовательно — артефактов на самой спектрограмме. Вслед- 
ствие этого элементы речевого сообщения, произнесенные с малой 
громкостью (например, звуковые элементы некоторых безударных 
слогов), могут оказаться ниже порога чувствительности регистри- 
рующей части спектрометра. Разрешающая способность электро- 
чувствительной бумаги значительно уступает чувствительности 
слуха, так что на участках безударных слогов часто не удается 
выявить визуально детали спектральной динамики речевого си- 
гнала, если в течение его произнесения имелись существенные 
перепады в интенсивности, что часто имеет место в естественной 
речи. В таких случаях приходится снимать динамическую спектро- 
грамму речевого сообщения по частям. 
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Рис. 1.3.1. Сонограф фирмы Кау ЕПесёс Согр. 


На рис. 1.3.2 приведены примеры динамических спектрограмм 
двух звукосочетаний — ивУ (слева) и укА (справа). На спектро- 
граммах отмечается характерная структура в виде вертикальных 
полос в области гласных и звонких согласных звуков, которая 
отражает работу голосовых связок. Частота следования верти- 
кальных полос определяется частотой основного тона голоса Ро. 
Особенно четко выделяются области концентрации акустической 
энергии, положение которых изменяется по частоте и во времени. 
Это форманты гласных, особенно ЁІ и #2, и шумные признаки 
согласных звуков. 

На рис. 1.3.3. приведено схематическое изображение звукосо- 
четания типа гласный—согласный— гласный *. На нем показаны 
наиболее важные характеристики входящих в такой слог звуков — 
гласных и согласных, которые можно наблюдать также на 
спектрограмме естественно произнесенных слогов на предыдущем 
рисунке. 


* Мы будем пользоваться для обозначения звукосочетания типа гсГ тер- 
мином «слог». Конечный ударный гласный обозначен большой буквой. 
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Рис. 1.3.2. Примеры динамических спектрограмм, выполненных с помощью 
звукового спектрографа фирмы Кау Еіесігіс Согр. Слева — слог [укА], спра- 
ва — слог [иву]. 


На участках гласных обращает на себя внимание наличие 
основной частоты Ё, — свидетельство вибрации голосовых связок. 
Изменение основной частоты голоса содержит важную просоди- 
ческую информацию, а сам факт наличия или отсутствия фонации 
имеет фонетическую значимость, отделяя сонорные звуки (глас- 
ные, звонкие, согласные, сонанты) от глухих согласных. 

Форманты гласных РЕ! и ЁР?2, в частности их частоты Ё; 
и Ё — основные отличительные признаки этой группы звуков *. 
Формантная структура гласных и ее изменение в речевом потоке 
несут фонетическую информацию о конфигурации речевого трак- 
та, которая отражает характер произношения не только самого 
гласного, но также и ближайших согласных. Первые две фор- 
манты как бы отражают два наиболее значимые резонанса по- 
лости рта, образуемые в ней движением языка. Однако, как 
справедливо отмечает Л. В. Бондарко [1], было бы большим 
упрощением представить себе тело языка как некоторую перего- 
родку, наподобие плотины, которая делит русло воздушного по- 
тока в ротовой полости на две, хотя и постоянно изменяющиеся 
части. Факторов, меняющих конфигурацию полости, значительно 
больше — это и напряженность языка, и его форма — то сжимаю- 
щаяся в комок, то распластывающаяся в виде пластинки, то су- 
жающаяся на конце наподобие клина, то свободно расслабленная, 
как занавеска. Все эти факторы влияют на частотное положение 
первой и второй формант, а также вызывают появление формант 
более высоких порядков. Движение губ, нижней челюсти, надгор- 
танного хряща, небной занавески, напряжение гортани также сме- 


* В дальнейшем мы не будем диффереицировать обозначений Ро, Ра, Рг 
и РО, 21, 22. 
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Рнс. 1.3.3. Схема акустических признаков, обладающих повышенной 
фонетической информативностью иа динамической спектрограмме 
слога типа гласный — согласиый — гласный. Ро — осиовная частота, 
Е, — первая форманта, Ё: — вторая формаита, Та — время фона- 
ции, Го — время паузы, Гы — время шума, / — интенсивносту, звука 
в полной спектральной полосе, Ја — интенсивность аспиративного 
шума, Гф — интенсивность фрикативного шума, Ма и Му — соответ- 
ственно центральные частоты аспиративного и фрикативиого шумов. 


щают частоты главных формант гласных и других элементов 
спектрального описания речевого отрезка, которое представляет 
собой достаточно сложную картину вследствие многокомпонент- 
ности факторов ее обусловливающих. 

Наиболее существенной характеристикой звуков речи, на кото- 
рой постоянно заостряется внимание в нашей книге — это движе- 
ние формант, вызванное коартикуляцией звуков, их взаимное 
влияние друг на друга в речевом потоке. Влияние будут оказы- 
вать согласные звуки на гласные, и форманты последних будут 
изменяться, двигаться по шкале частот, отображая движение глав- 
ных артикуляторов — губ и языка. Такое влияние могут оказы- 
вать также гласные на отдельные признаки согласных звуков, 
поскольку произнесение одного и того же (номинально) согласного 
на фоне разных гласных вызывает порой совершенно различные 
картины их динамических спектров. 

Согласный схематически представлен на рис. 1.3.3 между двумя 
гласными. Если согласный глухой, то в нем отсутствует признак 
основной частоты Ро. Однако у звонких согласных и у сонант 
этот признак налицо. В этом случае визуальное разделение глас- 
ных и согласных усложняется. 

У взрывных согласных выделяется признак смычки. Если со- 
гласный и смычка глухие, то последняя выступает в виде акусти- 
ческой паузы Ти, отражая факт абсолютного прекращения потока 
воздуха. Если взрывной согласный звонкий, то при таком же пре- 
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кращении выхода воздуха через артикуляторную трубу одновре- 
менно работают голосовые связки, смычка становится звонкой, 
и на спектрограмме отражается полоса основного тона. В случае 
носовых согласных открывается вход в носоглотку, и воздушный 
поток проходит через нос, а следовательно, кроме основной часто- 
ты на спектрограмме появляются дополнительные резонансы — 
носовые форманты. 

Наконец, важной характеристикой многих согласных является 
спектр шума, образующегося при их произношении. Шум может 
занимать различные частотные положения в спектре, которые сле- 
дует оценить некоторым центральным значением его частотной 
полосы. В тех случаях, когда шум вызван трением, он расположен 
в более высокочастотной области по сравнению с теми случаями, 
когда он возникает вследствие придыхания или аспирации, и ло- 
кализуется в более низкочастотной области спектра. Наряду 
с центральными значениями фрикативного и аспиративного шумов 
Му и М. следует обращать внимание и на неодинаковую ширину 
полосы в спектре, которую занимают различные шумные соглас- 
ные. Информативным признаком является также интенсивность 
шума согласных как в целом (Г), так и в разных его спектраль- 
ных участках Г; и Г, . 

По длительности шума короткие взрывные согласные со спект- 
рально нечетким взрывом отличаются от более длительных аф- 
фикатов и полностью заполненных шумовыми составляющими 
щелевых согласных. Если к артикуляционному шуму добавляется 
работа голосовых связок, то глухие согласные как бы преобра- 
зуются в соответствующие звонкие пары. 

Огромное число исследований, выполненных с помощью «види- 
мой речи», было направлено на выявление наиболее характерных, 
сравнительно инвариантных свойств тех или иных звуков речи, на 
нахождение различительных признаков соответствующих групп 
фонем, а также многих других фонетически или тембрально зна- 
чимых особенностей сложной картины речевого сигнала. Имеется 
ряд работ, в которых обобщается опыт «чтения» динамических 
спектрограмм [42, 44, 40, 47 и др.. Авторы их с разной долей 
оптимизма относятся к возможности практической реализации 
и алгоритмизации процесса «чтения» динамических спектрограмм. 
Тем не менее исследования дают возможность сформулировать 
биофизические и психолого-лингвистические условия, при соблю- 
дении которых этот процесс может быть успешно доведен до 
конца. 

Большая часть динамических спектрограмм данной книги была 
снята с помощью спектрографа Уо!се Ргіпі типа 4691 в условиях 
подъема высоких частот 6 дБ на октаву, начиная с 300 Гц. В книге 
сохранен систематический подход к спектральной документации 
звуков, слогов, слов и фраз русской речи, который в сущности 
отводит текстовой части книги роль комментариев к множеству 
ее динамических спектрограмм. 


ГЛАВА П 


ГЛАСНЫЕ ЗВУКИ РУССКОЙ РЕЧИ 
И ИХ СПЕКТРАЛЬНАЯ ХАРАКТЕРИСТИКА 


Все звуки русской речи принято разделять на гласные и со- 
гласные. Однако это хорошо интуитивно понимаемое классифи- 
кационное различие не всегда легко осуществить объективными 
методами, когда ставится задача их различения в естественной 
речи на основе акустических характеристик. 

При описании звуков речи, а следовательно и их идентифика- 
ции, обычно учитываются три главных фактора, на которых по- 
строена классификация звуков: по их образованию, по звучанию, 
по их роли в языке [1, 16, 23, 24, 34]. 


2.1. ГЛАСНЫЕ ЗВУКИ РЕЧИ С ТОЧКИ ЗРЕНИЯ 
ИХ ОБРАЗОВАНИЯ И РОЛИ В ЯЗЫКЕ 


В русском языке шесть гласных — и, о, а, э, ы, и. Работа лег- 
ких и голосовых связок при образовании всех гласных примерно 
одинакова, носовая полость обычно отключена поднятием небной 
занавески. За исключением шепотной речи, голосовые связки не- 
пременно участвуют в образовании гласных. Таким образом, глас- 
ные различаются лишь по работе языка и губ. 

В. А. Богородицкий дал классическое определение гласных, 
контрасно отделяющее их от согласных по выделенному направ- 
лению усилий мышц, которые управляют конфигурацией полости 
рта: гласные — это ртораскрыватели, согласные — ртосмыкатели 
[23, 24]. 

При образовании гласных в полости рта не образуются допол- 
нительные препятствия на пути движения воздуха, а следователь- 
но, нет источника шума. Тональный сигнал, генерируемый голосо- 
выми связками, видоизменяется благодаря изменениям конфигу- 
рации надгортанных полостей, которые играют роль управляемых 
резонаторов. | 

При произношении гласных язык в разной степени поднимается, 
вследствие чего обычно выделяют три положения его по отноше- 
нию к твердому небу — верхнее, среднее и нижнее. Выше всего 
поднимается язык при произношении гласных и, ы, у, которые 
поэтому называются гласными высокого подъема, или закрытыми. 
Самое низкое положение занимает язык при артикуляции гласного 
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а, являющегося гласным низкого подъема, или открытым гласным. 
Промежуточное положение занимает язык при произнесении глас- 
ных э и о, которые являются гласными среднего подъема. 
Язык может подииматься к небу передним, средним и задним 
участками. Поэтому принято говорить о трех рядах гласных — 
переднем, среднем и заднем. Таким образом, различают гласные 
в зависимости от продвинутости артикуляционно активной части 
языка, которая напрягается. При артикуляции гласных и и э язык 


Таблица 1. Классификация гласных звуков русского языка 
(реконструкция по [1, 23]) 


Ряды (продвинутость языка вперед) 





Подъем (языка к небу) 


передний | средний | задний 
Верхний (закрытые глас- и ы у (Сильная огуб- 
ные) ленность) 
Средний э о (Средняя огуб- 
ленность) 
Нижний (открытые глас- а (Нет огублен- 
ные) ности) 


сжимается в комок, расположенный в передней части полости 
рта — это гласные переднего ряда. При образовании же гласных 
о и у язык сжимается у задней части полости рта, в силу чего это 
гласные заднего ряда. 

В образовании звуков заднего ряда, помимо языка, участвуют 
губы, они вытягиваются вперед и округляются. Поэтому гласные 
у и о называются огубленными, или лабиализованными [1]. 

В табл. 1 приведена классификация гласных звуков русско- 
го языка, основанная на традиционном, упрощенном анализе явле- 
ния, достаточном для наших целей. Более сложные критерии и 
принципы классификации звуков речи, исходящие, например, из 
синтагматической фонетики, можно найти в специальных руко- 
водствах по русской фонетике [16, 24]. 

Следует понимать, однако, что любая классификация — это 
прокрустово ложе для естественного объективного процесса, ко- 
торый протекает независимо от нашего желания расставить его 
по классификационным рубрикам. Сказанное полностью относится 
к звукам, посредством которых реализуется естественная речь. 
Язык в процессе произношения постоянно двигается, а.следова- 
тельно, гласные звуки речи постоянно смещаются вдоль указанных 
передне-задней и нижне-верхней фонетических осей. Например, 
если мы хотим произнести звук а, чтобы сказать слово «папа», 
то команды, управляющие движением языка, будут направлены 
на достижение нижнего подъема, т. е. на опускание тела языка 
и на удержание средней продвинутости его в продольном направ- 
лении. В идеальном случае это стремление приведет к возникно- 
вению звука а, соответствующего его положению в приведенной 
выше таблице. | 
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Конечно же, в реальных случаях множественные реализации 
звука а не попадут в одну точку нашей двухкоординатной таб- 
лицы, а рассеются по ней, варьируя как по подъему, так и по сте- 
пени продвинутости. Кроме того, произнося гласные, мы не только 
управляем движением языка, но и по-разному распределяем его 
массу, напрягаем гортань, по-разному открываем и закрываем рот, 
двигая нижней челюстью и губами, наконец, часть воздуха мы 
можем направлять в нос. А если учесть, что размеры артикуля- 
ционного аппарата у людей различные и органы речи вследствие 
инерции и ограниченного времени произношения далеко не все- 
гда достигают своих номинальных Положений, то мы сможем 
представить, сколь огромно разнообразие реальных звуков в ес- 
тественной речи и сколь многообразны их отклонения от идеаль- 
ных классификационных позиций. Особенно много оттенков 
у гласных звуков вследствие большой подвижности языка и губ, 
обусловливающих их образование. 

Тем не менее звуковой состав русского и любого другого язы- 
ка отнюдь не бесконечен. Звуки в языке группируются в функцио- 
нально значимые группы, количество и структура которых за- 
крепляются практикой речевого общения. Это фонемы данного 
языка. Внутри фонемы отдельные ее реализации обладают доста- 
точным разнообразием, а их акустические выражения могут совпа- 
дать со звуковыми реализациями других фонем. Важно то, что 
как функциональная единица языка фонема выполняет смысло- 
различительную функцию, ибо замена одной фонемы на другую 
может, в принципе, изменить смысл произиесенного слова. Для 
гласных это хорошо видно на примере слов «бук», «бок», «бак», 
«бык» и т. п. Так же, как вид в биологии реализуется через от- 
дельных его представителей, так и фонема в фонетике выступает 
в виде ее отдельных звуковых реализаций. 

Выше было отмечено, что в инвентарь русских гласных входит 
шесть фонем — у, о, а, 3, ы, и. В зависимости от положения в сло- 
ве они претерпевают достаточно характерные изменения, которые 
можно учесть как варианты произношения фонемы и обозначить 
отдельными транскрипционными знаками. Мы не собираемся, од- 
нако, рассматривать проблему фонетической транскрипции вариан- 
тов гласных. Для наших целей важно отметить, что среди вариан- 
тов фонем, так называемых аллофонов, выделяется основной ва- 
риант, основной звук, который осознается, когда говорят о звуках 
речи. Главные варианты гласных фонем хорошо представлены 
реализациями изолированных гласных звуков [У], [0], [а], [3], 
[ы], [и]. Они также реализуются в серединной части звука в удар- 
ных слогах между твердыми согласными, за исключением глас- 
ного и, типичная реализация которого выступает между мягкими 
согласными. 

Кинематографическая съемка движения артикуляционных ор- 
ганов при помощи рентгеновских лучей сыграла в эксперимен- 
тальной фонетике чрезвычайно большую роль. Именно благодаря 
ей были построены практически для всех изучаемых в этом плане 
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языков фонетические профили, показывающие в разрезе типичные 
позиции артикуляционных органов при произношении разных 
звуков. 

На рис. 2.1.1 отображены стилизованные фонетические про- 
фили гласных звуков: русской речи. Их положение изображено на 
частотных осях первой (по горизонтальной) и второй (по верти- 
кальной оси) формант. Рядом с каждым профилем показан ха- 
рактерный спектр данного гласного, синтезированный по соответ- 
ствующему положению его формант. На этом же рисунке, рекон- 
струированном по работам Г. Фанта [29, 38], показан также так 
называемый формантный треугольник, по вершинам которого рас- 
положены фонетические экстремумы— гласные у, а и и. Вдоль ли- 
ний, соединяющих эти экстремумы, флуктуируют не только реаль- 
ные индивидуальные звуки одного, например, русского языка, но 
также и гласные всех индоевропейских языков. Движение по оси 
у — и соответствует смещению по ряду гласного (продвинутости 
языка вперед) от заднего ряда в у через средний ы к переднему 
ряду в и при одинаковом верхнем подъеме языка к небу, который 
обусловливает наибольшее у этих гласных сужение речевого трак- 
та, расположенного в разных его местах. Движению по оси у — и 
соответствует смещение вверх второй форманты этих гласных от 
величины 2600 Гц в у до 22000 Гц вы и 2500 Гцв и*, 

Гласные среднего подъема о и э имеют меньшую степень суже- 
ния артикуляционной трубы, но в соответствии с различиями по 
раду само место сужения размещено значительно ближе к перед- 
нему концу у переднего э, чем у заднего о. Поэтому по оси 0— э 
растет частота #2, но, естественно, меньше, чем по оси у—и. 

Нижний по подъему гласный а является наиболее открытым, 
и сужение речевого тракта в этом случае минимально. Оно распо- 
ложено сзади, у надгортанника. На сложность определения ряда 
для а указывает Л. В. Бондарко [1], которая справедливо, на наш 
взгляд, относит звук а к гласным заднего ряда. Он имеет самое 
высокое положение первой форманты и компактно сближенную 
с ней на частотной шкале вторую форманту. 

По оси а— у частота ЁЕ1 уменьшается, оставаясь компактно 
сближенной с частотой Ё2, которая тоже понижается вдоль оси. 
Это смещение формант коррелирует с движением языка в направ- 
лении уменьшения его подъема к небу для гласных заднего ряда. 

По оси а — и происходит расхождение формант Ё1 и Ё? в обе 
стороны с потерей компактности и проявлением диффузности их 
размещения по частотной шкале. Близко расположенные для а 
в срединиой части около частоты 1000 Гц обе форманты все больше 
расходятся и если у а расстояние между ними имеет порядок 
300—500 Гц, то у э оно достигает 1000 Гц и более, а у и может 
приближаться к 2000 Гц. Это расхождение формант соответствует 


* Прнводимые числовые значения частот формант не следует абсолю- 
тизировать, так как их колебания могут составлять в естественной речи от 
10 до 20 % номинальных величин. 
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Рис. 2.1.1. Контуры речевого тракта по данным рентгенограмм для русскнх 

гласных и их стилизованные спектры, полученные методом сннтеза [38]. Фо- 

нетические профнлн показывают место н степень сужения в ротовой полостн, 

образованного языком. Частотная характеристика гласных показана в завн- 

симости от частоты первой (по оси абсцисс) и второй (по осн ординат) 

формант. Возле каждой гласной показан его типнчный спектр. Сплошной 
лннией показан формантный треугольник с вершинами у, @, и. 


сложному диагональному скольжению характеристик гласных зву- 
ков по обеим фонетическим осям. 

Возвращаясь к функциональным свойствам гласных звуков 
русской речи, необходимо также подчеркнуть, что по своей роли 
в языке они являются основными слогообразующими звуками. 
В частности, на гласном может быть ударение в слове, тогда как 
согласный этим свойством не обладает. Эта своеобразная роль 
гласных определяет их немаловажную функцию в процессе вос- 
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приятия звуковой речи человеком, а также при «чтении» дина- 
мических спектрограмм. Фонемная интерпретация гласных очень 
важна в этом плане для достижения конечной цели. Мы хотим 
при этом еще раз подчеркнуть, что механизм фонемной интерпре- 
тации звуков речи вырабатывается у человека в процессе языко- 
вого общения. Он осуществляется в восприятии далеко не по фор- 
мальным схемам статистической таксономии, а неразрывно связан 
с канвой языкового мышления в категориях и функциях языка. 


2.2. ГЛАСНЫЕ ЗВУКИ РЕЧИ С ТОЧКИ ЗРЕНИЯ 
ИХ АКУСТИЧЕСКИХ ХАРАКТЕРИСТИК 


Акустические, в частности спектральные особенности гласных, 
обусловленные разными положениями артикуляционных органов, 
определяют характеристику их звучания, своеобразный тембр. 
Тембр вокальных сигналов, в котором особую роль играют спект- 
ральные характеристики первых двух формант, выполняет важную 
фонетическую функцию — по значениям формант можно восста- 
новить наиболее информативные параметры речеобразующего 
тракта. Существенно также и то, что тембр, это своеобразное 
звучание гласных, имеет фонемное значение, обладающее смысло- 
различительной функцией в языке. 

Опытный фонетист или экспериментатор, прослушивающий на 
сепараторе отдельные отрезки гласных в различных окружениях 
или взятые из разных слов, может определить в них специфиче- 
ский оттенок, присвоив ему свой фонетический знак. Такие опыты 
для русской речи провел Н. И. Дукельский [14]. Различные вари- 
анты произнесения гласных имеют своеобразный оттенок, в боль- 
шей или меньшей мере определяемый правилами коартикуляции 
с соседними звуками. 

Основная цель настоящего раздела состоит в том, чтобы озна- 
комить читателя с динамическими спектрограммами гласных зву- 
ков русской речи. Приведенный здесь материал произносился 
мужским голосом одним из авторов (М. Д.). Диктор хорошо вла- 
деет русской речью, хотя с фонетической точки зрения — это не 
речь профессионального диктора. Сказанное следует иметь в виду, 
поскольку приведенные данные не претендуют на ранг фонети- 
ческих стандартов произношения, а являются документом разли- 
чий в динамических спектрограммах звуков речи в условиях их 
естественного произношения. 

Гласные произносились изолированно, удлиненно, как бы 
«сдвоенным» образом, с ударением на втором элементе — [аА], 
[00], [УУ] и т. д.* Это было сделано потому, что на фоне таких 
«сдвоенных» гласных дальше следовало произношение слогов типа 
гласный —согласный—гласный, о которых пойдет речь в следую- 
щей главе. На рис. 2.2.1 приведены динамические спектрограммы 


* Звуковую реализацию ударного гласного мы здесь и в дальиейшем 
будем транскрибнровать большой буквой. 
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Рис. 2.2.1. Динамические спектрограммы русских гласных. Слева направо: 


верхний ряд — у, о; средний — а, 3; ннжний — Ы, и. 
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всех шести гласных русской речи. В верхнем ряду показаны спект- 
ры гласных у (слева) ио (справа). В звуке у обе форманты рас- 
положены компактно и в предельно низком частотном положении 
(Ё1= 400 Гц, 22=600 Гц). В звуке о первые две форманты тоже 
размещены компактно, но обе они смещены несколько вверх по 
частотной шкале (Р1=500 Гц, 22=800 Гц). В обоих звуках более 
высокие форманты имеют очень слабую интенсивность и еле за- 
метны на спектрограммах. 

В среднем ряду приведены слева спектр звука а и справа зву- 
ка э. Достаточно компактное расположение первых двух формант 
у а (Е1=900 Гц, Е2=1300 Гц) заменяется их диффузным, разъе- 
диненным положением у э (Р1=600 Гц, Р2=2000 Гц). Постепенно 
возрастает интенсивность формант более высоких порядков, кото- 
рые хорошо видны у а и особенно у э. Следует иметь в виду, что 
выраженность высокочастотных формант обусловлена подъемом 
высоких частот в сонографе, начиная с 300 Гц, на 6 дБ на октаву. 

В нижней части рисунка приводятся спектрограммы гласных 
ы (слева) и и (справа). Отчетливо видна дифтонгоидность начала 
гласного ы, у которого явно выражено постепенное повышение 
второй форманты в начальной части от 1800 Гц, близкого к зна- 
чению э, до 2200 Гц, близкого к значению и и выше. Это доста- 
точно характерный признак гласного ы с точки зрения спектраль- 
ной динамики его произношения как своеобразного дифтонга ыи. 
Расположение формант Ё1 и Ё2 усиливает диффузность этого 
звука (Е1=400 Гц). Наконец, у и расстояние между частотами 
первой и второй формант достигает максимума (РІ = 300 Гц, Ё2= 
= 2500 Гц). В обоих случаях вследствие подъема высоких частот 
хорошо видны более высокие форманты. Заметному сближению 
22 и ЁЗ у звуков э и ы не следует приписывать существенного 
различительного значения, так как это свойство подвержено боль- 
шой изменчивости *. 

На рис. 2.2.2 показаны динамические спектры разнообразных 
дифтонгов. Они подобраны таким образом, чтобы в их состав вхо- 
дили экстремальные звуки формантного треугольника гласных, 
у, аии. 

В верхнем ряду рисунка показаны спектры дифтонгов уА и џи. 
Слева дифтонг УА демонстрирует движение формант задних глас- 
ных от верхней (у) к нижней (а) градации подъема по оси уве- 
личения открытости у — а. Видно, как сохраняется компактность 
расположения формант ЁІ и 22 при плавном повышении их час- 
тот. Справа на спектрограмме дифтонга уИ показано движение 
второй форманты по оси продвинутости напряженной части языка 
от заднего (у) к переднему (и) ряду для гласных верхнего подъе- 
ма. Отчетливо видно, как стремительно растет частота Ё2 по мере 
достижения у и передней позиции тела языка, переходя от макси- 
мальной сближенности формант к максимальной их разобщенности. 


* Частотное положенне формант дается с округлением до +100 Гц, такая 
точность вполие достаточна для визуального анализа динамических спектрограмм, 
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Рис. 2.2.2. Динамические спектрограммы дифтонгов [УА], [УИ] — верхний 


ряд; [аУ], [а] — средний и [ИА], [иУ] — нижний. Ударение всегда на вто- 
ром элементе дифтонга. 


В среднем ряду (рис. 2.2.2) показаны спектры дифтонгов аУ 
и ан. Обратите внимание на сохранение компактности располо- 
жения обеих формант при движении по оси а— у от нижнего 
к верхнему подъему языка в дифтонге аУ. Мы в состоянии сейчас 
проанализировать расхождение формант при произношении диф- 
тонга 2И: подъем второй форманты Ё2 вверх отображает движе- 
ние по оси продвинутости языка от задней к передней позиции 
(по раду), а движение первой форманты ЕІ вниз отображает 
подъем языка от нижней к верхней позиции по оси подъема. 

В нижнем ряду (рис. 2.2.2) приведены динамические спектро- 
граммы дифтонгов иА и иу. Движение формант на спектрограм- 
мах совершается в обратном порядке по сравнению со спектро- 
граммами ан и УИ. Хорошо видно сохранение локализации фор- 
мант у соответствующих гласных — компонентов дифтонгов — 
и плавность движения формант. В дальнейшем, при рассмотрении 
материала с согласными звуками, мы увидим, как будет изменять- 
ся плавный ход формант между гласными, если между ними бу- 
дет внедряться согласный звук, и дифтонг будет превращаться 
в слог типа гласный—согласный— гласный. 

Заканчивая рассмотрение динамических спектрограмм гласных 
звуков, целесообразно сделать ряд количественных замечаний 
о которых упоминает Г. Фант [29]. Нижняя граница первой фор- 
манты, достигаемая при полном закрытии рта и носа, близка 
к 200 Гц. Мы увидим это, когда будем рассматривать спектр 
смычки у звонких взрывных согласных. Ширина формант нижне- 
частотной области больше (примерно 90 Гц), чем в высокочастот- 
ном диапазоне, где на частоте около 2000 Гц она имеет величину 
порядка 50 Гц. Последние работы показали, что ширина первой 
форманты существенно отличается для передних и задних глас- 
ных. Она также может значительно изменяться даже на протя- 
жении одного периода основного тона. В принципе, каждый учас- 
ток резонаторной системы голосового тракта влияет на положение 
всех формант, причем в весьма различной степени. Поэтому ча- 
стотный паттерн формант на самом деле значительно сложнее по 
своему артикуляционному происхождению, чем это может пока- 
заться на первый взгляд. Тем не менее доминирующая роль фор- 
мант, особенно двух первых, среди акустических характеристик 
речи не вызывает сомнений, и нам придется постоянно прибегать 
к формантам гласных и их динамике как к ключевым акустиче- 
ским признакам при фонемной идентификации звуков речи путем 
«чтения» динамических спектрограмм. 


ГЛАВА Ш 


СОГЛАСНЫЕ ЗВУКИ РУССКОЙ РЕЧИ 
И ИХ ДИНАМИЧЕСКИЕ СПЕКТРЫ 


31. ФОНЕТИЧЕСКАЯ КЛАССИФИКАЦИЯ СОГЛАСНЫХ 
И ИХ РОЛЬ В ЯЗЫКЕ 


Согласных звуков в русской речи значительно больше, чем 
гласных. Они выполняют в языке словоразличительную функцию. 
Их роль в этом плане более значительная, чем гласных. Соответ- 
ственно с этим и по своему артикулационному образованию со- 
гласные гораздо сложнее гласных, что находит свое отображение 
в их спектрально-временных характеристиках. 

Воздушный поток, создаваемый в речевом тракте. действием 
дыхательной системы, модулируется в случае согласных иными 
способами, чем при образовании гласных (рис. 3.1.1.). Если при 
артикуляции гласных периодическая модуляция обусловлена ко- 
леблющимися голосовыми связками (левая часть рисунка), то при 
образовании щелевых согласных, показанных в средней части ри- 
сунка на примере согласного ш, возникает турбулентность в пото- 
ке, проходящем через место резкого сужения речевой трубки, 
а образование взрывных согласных (правая часть рисунка) про- 
исходит при быстром открывании полной смычки [34]. 

При описании согласных с артикуляционной точки зрения важ- 
но установить тот активный орган, с помощью которого образуется 
определенный согласный звук. В системе согласных русского язы- 
ка такими органами являются губы и некоторые части языка. 
Отсюда берут свое название губные, переднеязычные, среднеязыч- 
ные и заднеязычные группы согласных, различающиеся таким 
образом по месту своего образования. 

В месте активно действующего органа возникает шум, который 
по своему характеру может быть турбулентным или импульсным, 
в зависимости от способа образования согласного. В случае рез- 
кого размыкания сомкнутых артикуляторов возникает короткий, 
взрывообразный шумовой импульс. Если шум возбуждается бла- 
годаря образованию узкой щели в соответствующем месте рече- 
вого тракта и усиленного трения (фрикции) воздушной струи, то 
возникают турбулентные акустические явления, приводящие к об- 
разованию щелевых или фрикативных звуков речи. Артикуляцион- 
ная щель может образовываться в разных местах речевого тракта 
и в ряде случаев, например, у латерального л, может представ- 
лять трудности для формального описания. 
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[и] [4] [п] 


Рис. 3.1.1. Основные способы модуляции воздушного потока, 

обеспечивающие возникновение звуков речи [34]. Белые 

стрелки — звуковой сигнал, черные — место образования 
звука. 


Классификация согласных проводится с учетом расположения 
шумового источника по отношению к системе резонаторов. В част- 
ности, при образовании губных согласных шумовой источник на- 
ходится в передней частн артикуляционного тракта, тогда как 
система резонаторов в виде надгортанных полостей находится за 
источником. Вследствие этого губные согласные характеризуются 
наиболее слабым шумом. 

Переднеязычные согласные при произношении образуют не- 
большой передний резонатор между губами и местом передне- 
язычного сужения или смычки, в то время как за источником шума 
находится резонатор значительно большего размера. Шум перед- 
неязычных согласных имеет ббльшую, чем у губных, интенсив- 
НОСТЬ. 

При образованин заднеязычных согласных источник шума рас- 
положен за ротовым резонатором, размеры которого сравнимы 
или даже больше, чем полостей, размещенных за местом сужения. 
Шум заднеязычных согласных, особенно взрывных, вследствие 
этого достаточно сильный и размещен в низкочастотной части 
спектра. 

На рис. 3.1.2 приведено схематическое изображение положения 
артикуляционных органов при произнесении русских согласных, 
отличающихся активным действующим органом. Заштрихована та 
часть речевого аппарата, которая служит резонатором при обра- 
зовании импульсного шума разных взрывных согласных [1]. 

Своеобразным способом образования согласного р является 
дрожание передней части языка, которое в случае литературного 
русского произношения очень отчетливо проявляется на спектро- 
граммах. 

Промежуточный способ произношения между взрывными и 
фрикативными наблюдается у аффрикат. Они образуются, как 
и взрывные, в результате полного смыкания артикуляционных ор- 
ганов, но характер раскрытия смычки у них не резкий, а посте- 
пенный, с образованием щели и, как следствие, турбулентного 
шума, характерного для фрикативных согласных. 


32 


Рис. 3.1.2. Схематическое изображение положеиия артикуляционных ор- 
ганов при произнесении русских взрывных согласиых, отличающихся ак- 
тивным действующим органом [1]. 


Все согласные могут быть образованы с участием или без 
участия голосового источника [10]. В соответствие с этим соглас- 
ные, в образовании которых участвует фонация, называются вока- 
лизованными, или звонкими в противоположность глухим соглас- 
ным, в образовании которых голосовые связки не принимают уча- 
стия. 

Важным артикуляционным признаком образования согласных 
является участие или неучастие полости носа в их образовании. 
При произношении носовых . согласных небная занавеска опус- 
кается, и воздух в фазе смычки проходит через носовую полость, 
что придает назальным звукам соответствующий фонемный тембр, 
а их динамическим спектрограммам — характерный вид. 

Наконец, в системе согласных русского языка выделяются раз- 
личия по признаку твердости — мягкости. Характерной чертой 
произношения мягких согласных является обязательный подъем 
средней части языка к твердому небу — так называемый эффект 
Палатализации. Палатализация согласных, ведущая к их смягче- 
нию,— это дополнительный доминирующий артикуляционный жест, 
который накладывается на основное движение активного дей- 
ствующего органа в месте образования звука. Она характеризу- 
ется своеобразной динамикой коартикуляции с окружающими 
звуками, очень типично отражающейся на динамических спектро- 
граммах. 

В табл. 2 приведена классификация согласных звуков русского 
языка. В ней показаны следующие типы фонетических различий 
в образовании этих звуков: 

1) по работе голосовых связок (глухие и звонкие согласные); 

2) по месту образования (губно-губные, губно-зубные, передне- 
язычно-зубные, переднеязычно-небные, среднеязычно-небные, зад- 
неязычно-небные); 

3) по способу образования (взрывные, щелевые, смычно-щеле- 
вые, смычно-проходные и дрожащие); 

4) по наличию дополнительного подъема тела языка к небу 
(твердые и мягкие). 

Звук л обычно относят к группе переднеязычно-зубных соглас- 
ных, тогда как в настоящей таблице он помещен в группу перед- 
неязычно-небных, исходя из его спектральных характеристик. 

Отличительной особенностью спектра согласных, в частности 
всех глухих и сонорных носовых согласных звуков речи, является 
наличие в спектре антирезонансов. 2-картина нулей достаточно 
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Таблица 2. Классификационная таблица согласных звуков русского языка 
(реконструкция по [1, 23]) 





Место образования и дополнительная артикуляцня 









































с 
5 Е губные переднеязычные 
Я 5 Способ образова- и р средне: задне- 
Я = ння и работа го- губно- | губно- | передне- | передне- язычно- язычно- 
О. лосовых связок губные [зубные язычно- язычно- небные небные 
ЕО зубные небные 
88 ао Реа а сва 
ок тв м тв. м тв м м тв м 
глухие ћ, т т] т к к’ 
взрывные| === | бини Ноу и и и ——|— 
звонкие 6 6' 9] 0’ г г’ 
Ф глухие ф ф’ с| сС| ш х |х" 
2 щелевые ыы]. 2 м| 
=: звонкие в в | з| эЭ|ж 
смычно- 
глухие ч 
щелевые у 4 
смычно- | носовые м м н| н 
проход- |--—— | | 
ные , 
боковые л| Л 
Ф дрожащие А 
Е ЕТУ ИЕ ЕЕ ИБ Есе ИНИ 
2. 
о ~ 
Е щелевые й 
о 


сложно взаимодействует с Р-картиной формант, обусловливая 
разнообразие спектральных характеристик согласных звуков. 

Подробнее классификационные особенности каждого из соглас- 
ных будут обсуждены ниже при рассмотрении их динамических 
спектрограмм. 

Динамические спектрограммы согласных звуков приводятся 
в звукосочетаниях гласный—согласный—гласный с ударением на 
втором гласном. Такие звукосочетания мы будем условно называть 
слогом гсГ. 

Материал исследования был получен таким образом: сначала 
произносился удлиненный как бы сдвоенный гласный, а за ним 
слог гсГ. Например, [УУ] — [усУ], [00] — [0сО], [аА]— [асА], 
[99] — [923], [ЫЫ] — [ысЫ] и т. д. При переходе к другой группе 
согласных схема произносимого материала повторялась [УУ] — 
[УТУ], [00] — [отој, [аА] — [атА] и т. д. Этим достигалась унифи- 
кация произносимого материала: на фоне произнесенных «сдвоен- 
ных» гласных как бы «внедрялся» тот или иной согласный; полу- 
чаемый слог произносился в одном и том же темпе, и на динами- 
ческой спектрограмме изучались те изменения, которые при этом 
происходили. Эта же схема сохранялась, когда вместо удлиненного 
гласного произносился дифтонг, например, [аУ] или [иА]. 
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3.2. ДИНАМИЧЕСКИЕ СПЕКТРОГРАММЫ ГУБНЫХ СОГЛАСНЫХ 


К губным согласным относятся как губно-губные м, 6, м, так 
и губно-зубные ф и в. Все мягкие пары согласных выделены нами 
отдельно и будут обсуждены в конце этой главы. Рассмотрим 
динамические спектрограммы каждого из этих звуков в отдель- 
ности на фоне соответствующих симметричных гласных. 


3.2.1. Губно-губной (билабиальный) глухой 
взрывной согласный п 


Произношение согласного п как билабиального взрывного со- 
гласного состоит из двух раздельных во времени фаз — фазы 
смычки, когда губы сомкнуты, и фазы взрыва, когда они резко 
размыкаются. Поскольку звук п является глухим согласным, 
в процессе его образования голосовые связки не функционируют, 
так что фаза смычки здесь является глухой н представлена аку- 
стической паузой. На всех спектрограммах, приведенных на 
рис. 3.2.1, фаза смычки отчетливо видна. Длительность этой фазы 
может быть различной, однако ее присутствие на спектрограммах 
всех глухих взрывных обязательно. 

Фаза взрыва у п может быть выражена лучше или хуже. Чаще 
всего взрыв продолжается недолго, с резким фронтом нарастания 
интенсивности образующегося шумового импульса. Можно заме- 
тить, что перед огубленными гласными у и о взрыв согласного и 
часто бывает длиннее, чем перед неогубленными гласными, если 
при этом не наступает их палатализация, как в случае окружения 
гласными и. Не менее вариабельна и интенсивность взрыва, кото- 
рая во многом зависит от произвольных и индивидуальных фак- 
торов. Взрыв, образованный губами, имеет свой спектр, довольно 
размытый по частотной шкале вследствие его кратковременности. 
Спектральные ключи, характеризующие этот звук, заложены не 
только в спектре самого взрыва, но и в характере изменения фор- 
мантных характеристик окружающих его гласных *. 

Как билабиальный по месту своего образования звук п несет 
отпечаток эффекта смыкания губ на динамических спектрограм- 
мах в виде губно-губной коартикуляции окружающих его гласных. 
Этот коартикуляционный эффект выражен в виде понижения ча- 
стоты первой и второй формант, которые стремятся занять пре- 
дельно низкие частотные положения, отображающие факт смыка- 
ния губ. На фоне огубленного низкочастотного у этот эффект не 
заметен, однако уже на фоне о видно понижение обеих формант 
на стыке с согласным п, а в слоге апА этот эффект проявляется 


* Ориентироваться на спектральные характеристики фазы взрыва на дина- 
мических спектрограммах взрывных согласных можно далеко не всегда. В сущ- 
ности, классический метод динамической спектрографии не выявляет достаточно 
увереино спектральиые ключи этой категории звуков. Обнадеживающие резуль- 
таты получены при развитии этого метода в так называемых слуховых спектро- 
граммах, в которых учитываются механизмы слуховой рецепции. 
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Рис. 3.2.1. Динамические спектрограммы губно-губного глухого взрывного 

согласного п в симметрических слогах гласный —п— гласный. Слева напра- 

во: верхний ряд — [упУ], [опО}; средний — [апА], [пој нижний — [ыпЫ], 
[игИ]. 
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особенно четко как на первой, так и на второй формантах. В слу- 
чае эпЭ и особенно ыпЫ, где первая форманта гласных занимает 
низкочастотное положение, ее дальнейшее понижение заметно сла- 
бо, но зато понижение второй форманты на границе с п здесь 
видно отчетливо как в начальном, так и в конечном гласном слога. 

Слог ит И, как и все слоги, в которых согласный находится 
в окружении гласных и, занимает особое положение в силу воз- 
действия на согласный эффекта палатализации. Здесь и-образное 
положение формант удерживается на протяжении всего соглас- 
ного, вызывая его дополнительную палатальную артикуляцию, 
а это ведет к реализации мягкого согласного п. 

Таким образом, по движениям Ё2 вниз в окружающих гласных 
и по паузе в первой части согласного можно идентифицировать 
на динамической спектрограмме звук и, по крайней мере, в слогах 
типа гласный—п— гласный. Движение формант и особенно #2 
тем более заметно, чем выше форманты у окружающих звук п 
гласных. Что касается первой форманты, то произношение любого 
согласного ведет к понижению РБ] или к тенденции к такому по- 
нижению, отражая эффект сужения или закрытия прохода воздуху 
в артикуляционном тракте в его передней части. Понижение ХІ 
всегда сопровождает образование звука п, однако не только его, 
но и других, особенно губных, согласных. 


3.2.2. Билабиальный звонкий взрывной согласный 6 


Отличие в произношении звонкого б от глухого п заключается 
в наличии у 6 звонкой (вокализованнои) смычки. Оно реализуется 
на динамических спектрограммах симметричных слогов гласный— 
б—гласный в виде полосы основного тона, занимающей весь ин- 
тервал звучания согласного, включая его звонкую смычку и фазу 
взрыва. На рис. 3.2.2. приведены спектрограммы симметричных 
слогов, где губной б представлен в окружении всех шести гласных. 

Фаза взрыва у б принципиально мало чем отличается от тако- 
вой у и. Однако следует отметить меньшую интенсивность взрыв- 
ной части звонкого 6 по сравнению с глухим и. Это отличие по 
интенсивности звонких звуков, образующихся с включением фона- 
ции, распространяется на все глухие-звонкне пары русских со- 
гласных. 

Будучи губно-губным звуком по месту своего образования, 
согласный б привносит в динамику слога гласный—б— гласный 
фактор огубления. На спектрограммах этот эффект проявляется 
на стыках с гласными так же отчетливо, как и в случае п. Он 
состоит в понижении частоты второй форманты в окружающих 
гласных в месте непосредственного контакта с этим билабиаль- 
ным звуком, наряду с общим для всех согласных понижением Р1. 
В случаях окружения огубленными гласными у и о этот эффект 
не может проявиться в полной мере, однако важно отметить, что 
эффект смыкания губ в билабиальных б и п препятствует какому- 
либо повышению частоты второй форманты на стыках с другими 
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Рис. 3.2.2. Динамические спектрограммы губно-губного звонкого взрывного 


согласного б в симметричных слогах гласный — 6 — гласный. Слева направо: 
верхний ряд —{убУ], [060]; средний —[абА], [963]; нижний —[ыбЫ]; [иб’И]. 
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звуками; именно этот факт имеет информативное значение для 
идентификации губных согласных. Понижение частоты обеих фор- 
мант на стыках с билабиальным 6 лучше всего заметно на фоне 
гласных а вследствие сильного понижения частот их формант ХІ 
и Е2. В окружении гласных э и ы хорошо видно, как понижается 
частота второй форманты на стыке с билабиальным 6. Эти зф- 
фекты одинаково хорошо заметны и у глухого билабиального п, 
так что эффект смыкания губ, проявляющийся как понижение 
частот ЁІ и 22 на стыке с согласными этой группы, играет роль 
дифференциального ключа для того, чтобы отличить губные со- 
гласные от звуков с иным местом образования. 

Звук 6, как и звук п, легко палатализуется, превращаясь 
в окружении гласных звуков и в мягкий согласный б”. На при- 
мере слога иб’И видно, что здесь доминирует не эффект смыкания 
губ, т. е. понижения Р2, а проявляется эффект удержания и-06- 
разной конфигурации полости рта, которая характеризуется мак- 
симально высоким положением #2. 


3.2.3. Билабиальный смычно-проходной носовой согласный м 


Звук м принадлежит к числу сонорных согласных. Деление 
звуков на сонорные и шумные происходит в зависимости от соот- 
ношения в них шума и тона. В сонорных согласных, в том числе 
и у м, тон преобладает над шумом. 

Наиболее характерное отличие носового сонорного м от взрыв- 
ного б заключается в том, что воздушный поток проходит в тече- 
ние всей смычной фазы через носовое отверстие благодаря опуска- 
нию небной занавески и открытию носового пути. Поэтому спек- 
трограммы звука м отражают ряд специфических особенностей, 
показанных на рис. 3.2.3. 

В смычной фазе звука м достаточно четко проявляются допол- 
ннтельные носовые форманты в виде сравнительно узких резо- 
нансных полос, характеризующихся почти полной неподвижностью. 
Они отражают неподвижную конфигурацию полостей носа, кото- 
рые не подвергаются артикуляционному управлению и поэтому 
статичны на спектрограммах. Не следует придавать значения сов- 
падению или несовпадению частоты носовых формант с частотой 
истинных формант в окружающих гласных, так как резонансные 
характеристики носа в большей мере, чем любые иные, статичны 
и индивидуальны. 

Носовые звуки, в частности м, не так четко, как, например, 
б, отделены от окружающих гласных. Это отражено уже в фонети- 
ческой классификации м как смычно-проходного, тогда как 6 яв- 
ляется смычно-взрывным звуком. В большинстве случаев на дина- 
мической спектрограмме м нельзя отметить эффекта открытия губ 
в виде акустически выраженного импульса. 

В противоположность этому на динамических спектрограммах 
отчетливо проявляется коартикуляционный эффект движения фор- 
мант Е! и Е2 между соответствующими гласными. Низко распо- 
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Рис. 3.2.3. Динамические спектрограммы губно-губного сонорного носового 


согласного м в симметричных слогах гласный — м — гласный. Слева направо: 
верхний ряд — [умУ}, [омО]; средний — [амА], [эмЭ]; нижний — [ымЫ], [им’И]. 
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ложенные формантные локусы, отображающие хорошо выражен- 
ный у м эффект смыкания—размыкания губ, вызывают понижение 
частот РІ и 22 у соседних гласных, которое можно хорошо наблю- 
дать на приведенных спектрограммах слогов гласный—м—глас- 
ный, особенно в окружении гласных а, 3, ы. 

На спектрограмме слога им И хорошо проявляется эффект па- 
латализации в виде сохранения и-образной конфигурации полости 
рта в течение произношения мягкого согласного м’. 


3.2.4. Губно-зубной глухой щелевой согласный ф 


Этот звук произносится путем образования тонкой щели между 
нижней губой и верхними зубами. По характеру движения арти- 
куляционных органов звук ф — принципиально губной, т. е. обра- 
зуется путем резкого сужения речевого тракта в его передней 
части. 

В связи с этим обратим сначала внимание в серии динамиче- 
ских спектрограмм, приведенных на рис. 3.2.4, на характер движе- 
ния формант в окружающих гласных, т. е. на явление губной 
коартикуляции гласных, которая очень близка к аналогичной кар- 
тине движения формант в случае губно-губных взрывных соглас- 
ных. Первая и вторая форманты здесь или фиксируются на низких 
значениях частот, характерных для огубленных гласных у и о, 
или же в случае, если в слоге представлены неогубленные гласные, 
устремляются вниз, отражая губной тип артикуляции соглас- 
ного ф. 

Эффект палатализации согласного ф в слоге иф И тоже хоро- 
шо отражен на его динамической спектрограмме, где видно удер- 
жание на протяжении целого слога и-образного расположения 
формант ЁІ и 22. 

Шумовая составляющая у ф по своей частоте распределена 
на достаточно широком спектральном диапазоне порядка 4 кГц 
и более. Нижняя граница шума, как правило, сосредоточена на 
частоте второй форманты окружающих гласных; ниже ее распо- 
ложен достаточно четко проявляющийся антирезонанс. В спектре 
шума ф могут встречаться и высокочастотные составляющие. Они 
особенно заметны у ф между огубленными гласными у и обуслов- 
лены, по-видимому, дополнительным билабиальным эффектом, 
который усугубляет лабио-дентальный эффект и увеличивает пло- 
щадь трения в области возникновения звука у губ. 

В естественной речи, например в словах, интенсивность фри- 
кативного шума у ф невелика, если сравнить его с шумом ш или с. 
Однако при форсированно четком произношении в бессмысленных 
слогах его интенсивность может быть достаточно высокой. Вариа- 
бельность шума согласного ф по интенсивности хорошо видна на 
серии приведенных на рис. 3.2.4. динамических спектрограмм. 
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Рис. 3.2.4. Динамические спектрограммы губно-зубного глухого щелевого 
согласного ф в симметричных слогах гласный—ф- гласный. Слева направо: 
верхний ряд — [УФУ], [0фО]; средний — [афА}, [офа], нижний — [ыфЫ], [иф'И]. 
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3.2.5. Губно-зубной звонкий щелевой согласный в 


Серия динамических спектрограмм слогов гласный—в—глас- 
ный приведена на рис. 3.2.5. 

По характеру коартикуляции с окружающими гласными в — 
это озвученное ф. Такой же, как и у ф, эффект сужения передней 
части речевого тракта у губ удерживает ЁІ и 22 в крайне низком 
положении в слогах увУ и ово и заставляет РІ и 22 понижаться 
в слогах авА и 283. В слогах 383 и, особенно, в ывЫ этот эффект 
отчетливо виден только на 22 в силу низкого значения Ё1 в ука- 
занных гласных. 

В слоге ив’И лабиальная артикуляция подавляется палатали- 
зацией, так что твердый согласный в превращается в мягкий в’, 
сохраняя на интервале своего звучания и-образное расположение 
формант. 

Фрикативный шум у звонкого в заметно слабее, чем у глу- 
хого ф. Только в слоге увУ видно его распределение по всему 
спектральному диапазону (этот эффект, как и в слоге уфУ обу- 
словлен увеличенной площадью трения, распространяющейся на 
билабиальную область). Во всех остальных слогах шум звука в 
очень слабый и еле заметен при нефорсированном произношении. 
На ряде спектрограмм видно его низкочастотную границу, которая 
как бы подчеркивает ход второй форманты в слоге на участке 
согласного. 

Звук в как представитель звонких согласных обладает хорошо 
видной на динамических спектрограммах полосой основного тона. 
Остальные акустические ключи для этого звука достаточно не- 
определенны и поэтому в часто можно спутать с другими сонор- 
ными согласными. 


3.3. ДИНАМИЧЕСКИЕ СПЕКТРОГРАММЫ 
ПЕРЕДНЕЯЗЫЧНЫХ СОГЛАСНЫХ 


Переднеязычные согласные русского языка, как это следует 
из классификационной табл. 2, разделяются на две большие груп- 
пы по месту образования. Это переднеязычно-зубные и передне- 
язычно-небные согласные. Разница в их образовании состоит в ло- 
кализации места максимального сужения речевого тракта, обра- 
зуемого передней частью языка. При реализации переднеязычных 
согласных образуется передний резонатор, расположенный меж- 
ду губами и местом переднеязычной смычки. За этим местом, 
являющимся источником шума, расположен сравнительно боль- 
шой резонатор, образуемый ротовой полостью. Наличие резона- 
торных полостей оказывает заметное коартикуляционное влияние 
на окружающие гласные, в частности на движение их формант 
на стыке с согласными этой группы. 
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Рис. 3.2.5. Динамические спектрограммы губно-зубного звонкого щелевого со- 
гласного в в симметричных слогах гласный — в — гласный. Слева направо: 
верхний ряд — [УвУ], [овој средний — [авА}, [вз] нижний — [ывЫ], [ив'И]. 


3.3.1. Переднеязычно-зубной глухой взрывной согласный т 


Согласный т является глухим взрывным звуком, следовательно, 
его смычная часть представлена акустической паузой. На рис. 
3.3.1 приведены слоги гласный—т—гласный в симметричном окру- 
жении всех шести гласных. Глухая смычка на этих спектрограм- 
мах выступает весьма отчетливо. 

Источником звука в его взрывной фазе в случае т является 
импульсный шум. На приведенных спектрограммах слогов глас- 
ный—т— гласный взрывная фаза несколько форсирована и позто- 
му в ней, наряду с кратковременным взрывом, образуемым раз- 
мыканием рта движением кончика языка, отражен также шум 
дополнительного придыхания. В спектре придыхания удается уви- 
деть направление движения формант, характерное для передне- 
язычного т. Интенсивность взрыва у т сильно варьирует; в естест- 
венно произнесенных словах она редко бывает так форсированной, 
как в изолированно произнесенных слогах. Спектр взрыва т отли- 
чается от п своей высокочастотностью. Слуховое восприятие хоро- 
шо улавливает это различие в спектре взрывов т и п, несмотря на 
их кратковременность. К сожалению, звуковые спектрограммы, 
снятые при помощи сонографа, не в состоянии отразить столь 
тонких различий в спектре переднеязычного и губного взрыва. 

На спектрограммах симметричных слогов с согласным т мож- 
но проследить за характером коартикуляционного влияния этого 
переднеязычного звука на движение второй форманты в окружаю- 
щих гласных. Направление этого движения является, вне всякого 
сомнения, важным различительным признаком переднеязычно- 
зубных согласных, в частности т. Коартикулируя с переднеязыч- 
ным т, вторая форманта гласных на участках, прилегающих к т, 
особенно к его взрывной фазе, обнаруживает стремление к неко- 
торому среднечастотному положению, своеобразному локусу, на- 
ходяшемуся в области 1500—1800 Гц, т. е. примерно посредине 
того места, где размещаются значения Ё2 гласных а и э. Поэтому 
в гласных у, о, а при приближении к переднеязычному т вторая 
форманта отчетливо повышается. По этому признаку т в сим- 
метричных слогах легко отличить от звука и, если гласными в сло- 
ге выступают у, о или а. 

Легко заметить на динамических спектрограммах, что в окру- 
жении о и ы вторая форманта этих гласных на стыках с т пони- 
жается. Особенно хорошо это видно в начальной части конечного 
гласного, расположенного непосредственно после взрыва и нахо- 
дящегося под ударением. Вследствие одинакового нисходящего 
характера движения формант в этих случаях для губных и перед- 
неязычных согласных создаются объективные трудности при раз- 
личении в исследуемых слогах звуков п и т перед гласными эи ы 
по их динамическим спектрограммам. 

В последней спектрограмме рис. 3.3.1. на примере слога 
ит’И показан эффект палатализации согласного т, превращающий 
его в мягкий согласный т’. Помимо сохранения и-образного дви- 
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Рис. 3.3.1. Динамические спектрограммы переднеязычно-зубного глухого 

вврывиого согласного т в симметричиых слогах гласиый — т — гласный. Сле- 

ва направо: верхний ряд — [утуј, [отО]; средний — [атА}, [этЭ|, иижний — 
[ытЫ], [ит’И]. 
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Рис. 3.3.2. Динамические спектрограммы переднеязычно-зубного звонкого 

взрывного согласного д в симметричных слогах гласный — д — гласный. Сле- 

ва направо: верхний ряд — [удУ]. [одО]; средний — [адА], [эдЭ} нижини — 
[ыдЫ} [их И]. 
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жения формант ЁРІ и 22 на всем протяжении слога, здесь приме- 
чательно также то, что длительность взрывной фазы у мягкого т 
существенно возрастает, приближаясь к таковой у аффрикат. 


3.3.2. Переднеязычно-зубной звонкий взрывной согласный д 


Серия динамических спектрограмм для согласного д в окру- 
жении симметричных гласных приведена на рис. 3.3.2. 

Из спектрограмм хорошо видно, что главное фонетическое от- 
личие между д и т состоит в озвучении фазы смычки. Вокализо- 
ванная смычка проявляется на спектрограмме в виде полосы 
основного тона, за которой следует фаза импульсного взрыва. Сам 
взрыв у звонкого д выражен существенно слабее, чем у глухого т, 
и порой его не легко заметить на спектрограмме. Однако характер 
переднеязычной коартикуляции, осуществляемой с окружающими 
гласными, остается для д и т идентичным. Вторая форманта здесь 
так же отчетливо стремится к своему локусу, расположенному 
в той же частотной области 1500—1800 Гц, что и для звука т. 
Поэтому частота Ё2 повышается на стыках гласных с д в слогах 
удУ, одо, ада и понижается в слогах 2383, ыдЫ. Четко прояв- 
ляется для согласного д эффект его смягчения между симметрич- 
ными гласными и. Следует обратить внимание, что здесь, как 
и в случае переднеязычного глухого т, мягкость звонкого 0” удли- 
няет взрывную часть согласного. 


3.3.3. Переднеязычно-зубной глухой щелевой согласный с 


Звук с — один из ключевых звуков при чтении динамических 
спектрограмм. Турбулентный шум, образованный прохождением 
воздуха через щель между верхними зубами и кончиком языка, 
обнаруживается на динамической спектрограмме в виде высоко- 
частотной полосы шума, занимающей широкую спектральную об- 
ласть и заполняющей весь временной интервал звучания этого 
звука. Обладая сравнительно большой интенсивностью, шум со- 
гласного с характерно расположен в области высоких частот от 
3 кГц и выше, что хорошо видно на спектрограммах, приведен- 
ных на рис. 3.3.3. Иногда, особенно при подчеркнутом произно- 
шении, шумовые составляющие простираются и ниже, доходя до 
области второй форманты гласных звуков. Тогда на спектре со- 
гласного с видно характерное для переднеязычно-зубной артику- 
ляции движение второй форманты к локусу, расположенному в об- 
ласти 1500—1800 Гц. Этот ход второй форманты был в случае 
взрывного т скрытым на интервале акустической паузы в его глу- 
хой смычке. У фрикативных переднеязычно-зубных согласных с 
и з имеется характерный антирезонанс, расположенный несколько 
ниже максимума турбулентного шума. Это заметно ослабляет 
интенсивность шума в области первых формант, так что их следы 
зачастую теряются на динамических спектрограммах в интервале 
согласного. 
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Рис. 3.3.3. Дииамические спектрограммы переднеязычно-зубного глухого ще- 

левого согласиого с в симметричных слогах гласный — с — гласный. Слева 

иаправо: верхний ряд — [усУ|, [осО]; средний — [асА], [эсЭ} нижиий — [ысЫ], 
(ис'И]. 
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На приведенных иллюстрациях отчетливо видна типичная пе- 
реднеязычно-зубная коартикуляция, которая проявляется в дви- 
жении [2 к своему характерному локусу, размещенному между 
формантными областями гласных а и э. Мы можем без труда 
различить подъем Ё2 на границе фрикативного с с гласным в сло- 
гах усУ, осО и асА и ее понижение в слогах эсЭ и асЫ. 

Палатализация звука с, его превращение в мягкий согласный 
с хорошо видны на динамической спектрограмме слога ис’И, в ко- 
тором #-образное расположение формант сохраняется на протя- 
жении всего слога, 


3.3.4. Переднеязычно-зубной звонкий щелевой согласный з 


Қак видно из серии динамических спектрограмм на рис. 3.3.4, 
представляющих звук з в окружении всех шести симметричных 
гласных, основное отличие этого звука от его глухого аналога с 
состоит в фонации, заполняющей весь интервал звучания. На 
спектрограмме она отчетливо видна как полоса основного тона. 

Частотное положение шума существенно не отличается от та- 
кового у с, однако интенсивность шума здесь значительно меньше, 
что вообще характерно для любых пар глухих и звонких сог- 
ласных. 

Коартикуляционные феномены видны весьма отчетливо во всех 
слогах. Там, где частоты второй форманты Ё2 гласных доста- 
точно высоки (э09, ыдЫ), путь второй форманты хорошо просле- 
живается на участке самого согласного з, где видно ее понижение, 
обусловленное движением Ё2 к среднечастотному локусу, типич- 
ному для всех переднеязычно-зубных согласных — 3, с, т и д 

В слогах узУ, озО, азА интенсивность шума з в области фор- 
мант гласных значительно меньше, отчасти благодаря располо- 
женному здесь антирезонансу, однако общий характер коартику- 
ляционного движения второй форманты вверх к своему частот- 
ному локусу хорошо выражен на спектрограммах. 

Палатализация звука з и его фонетическое смягчение осущест- 
вляется так же, как и во всех обсуждаемых ранее случаях: в слоге 
из' И сохраняется и-образная артикуляция с соответствующим рас- 
положением формант на протяжении всего согласного з, превра- 
щая его в мягкий согласный 3'. 

К переднеязычно-зубным согласным принадлежит также аф- 
фрикат ц. Этот звук мы рассмотрим несколько позже вместе с дру- 
гим аффрикатом ч, принадлежащим к группе переднеязычно-неб- 
ных согласных. 


3.3.5. Переднеязычно-зубной носовой согласный н 


Особенность артикуляции этого сонорного звука состоит в том, 
что его произношение связано с опусканием небной занавески 
и открытием носового тракта, имеющего специфические резона- 
торы. Носовой согласный н проявляет достаточно большую схо- 
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Рис. 3.3.4. Динамические спектрограммы переднеязычно-зубного звонкого 

щелевого согласного з в симметричных слогах гласный — 3 — гласный. Слева 

направо: верхний ряд — [узУ], [030]; средннй — [азА], [э39]; нижний — [ызЫ], 
[из И]. 
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Рис. 3.3.5. Динамнческне спектрограммы переднеязычно-зубного сонорного 

носового согласного н в симметричных слогах гласный — н — гласный. 

Слева направо: верхний ряд — [унУ], [онО]; средний — [анА], [энЭ]; ниж- 
ний — [ынЫ], [ин’И]. 
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жесть со взрывным звонким согласным д, поскольку оба они об- 
разуются в одном и том же месте. 

На динамических спектрограммах симметричных слогов глас- 
ный—н— гласный, приведенных на рис. 3.3.5, мы наблюдаем 
типичную артикуляционную картину для переднеязычно-зубных 
согласных, как будто бы на спектрограмму звука д накладывают- 
ся резонансные полосы, соответствующие носовым полостям. Эти 
полосы, как и губного носового м, неподвижны, но нередко на 
участке носового н можно заметить также и следы ротовых фор- 
мант, являющиеся продолжением формант окружающих гласных 
и несущих информацию о конфигурации ротовой полости и о ее 
динамике на участке переднеязычно-зубного н. Иногда сонорный 
носовой н заканчивается небольшим щелчком, напоминающим 
взрывной щелчек у д, хотя, как правило, слабее выраженным. 

Что касается характера коартикуляционного движения фор- 
мант, в частности второй форманты 22, то здесь картина полностью 
напоминает типичное движение Ё2 к локусу переднеязычно-зуб- 
ных согласных, наблюдаемое в слогах с согласными 7, д, с, 3. 

Будучи в окружении гласных и с их высоким расположением 
второй форманты, звук н, как и все рассмотренные выше соглас- 
ные, сохраняет это положение и на участке своего звучания. 
Наступает палатализация согласного н. Он превращается в мяг- 
кий согласный н’. На приведенной спектрограмме слога ин’И вид- 
но сохранение и-образной формантной картины на протяжении 
всего слога, хотя носовые резонансные полосы незаметны. Следует 
отметить, что слоги ин’И и им’И достаточно трудно отличить на 
динамических спектрограммах. Кроме того, степень выраженности 
носовых формант у этих звуков весьма разнообразна. У передне- 
язычного н носовые резонансы часто лучше проявляются на 
спектрограммах вблизи соседних гласных. 


3.3.6. Переднеязычно-небный глухой щелевой согласный ш 


Звуком ш мы начинаем рассмотрение группы переднеязычно- 
небных согласных, к которым принадлежат также звуки ж и р. 
К этой группе с некоторым упрощением можно отнести и боковой 
согласный л. В отличие от группы переднеязычно-зубных соглас- 
ных т, 0, с, 3, н звуки переднеязычно-небной группы образуются 
в месте контакта передней части языка с твердым небом в его, 
как правило, тоже передней части. 

Согласные переднеязычно-небной группы в русском языке не 
имеют своих взрывных представителей, как, например, в англий- 
ском или шведском языках, где звуки 7 и д могут быть произ- 
несены при помощи контакта кончика языка с зубами или с не- 
бом; в последнем случае возникает так называемый ретрофлекс- 
ный вариант указанных согласных. 

Серия динамических спектрограмм глухого фрикативного звука 
ш на фоне симметричных гласных в слогах гласный —ш— гласный 
приведена на рис. 3.3.6. 
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Рис. 3.3.6. Динамнческие спектрограммы переднеязычно-небного глухого 

щелевого согласного ш в симметрнчных слогах гласный — ш — гласный. Сле- 

ва направо: верхннй ряд — [ушУ], [ошО]; средний — [ашА], [эшЭ]; нижний — 
[ышЫ} [ишИ]. 


54 


Как представитель глухих щелевых согласных звук ш харак- 
теризуется отсутствием основного тона и наличием шума на всем 
интервале своего звучания. Полоса шума щелевого ш хорошо 
выражена благодаря высокой интенсивности и занимает средне- 
частотную область от 1 до 5 кГц. Верхняя граница спектра шума 
ш лежит заметно ниже, чем таковая для фрикативного с, и в этом 
состоит отличие между звуками. Нижняя граница спектра шума 
ш расположена в области второй форманты окружающих гласных. 
Поэтому спектр его как бы подчеркнут снизу полосой второй 
форманты. Она показывает характер коартикуляции этого соглас- 
ного с окружающими гласными. Путь второй форманты в слоге 
гласный —ш-—-гласный прослеживается отчетливо на динамической 
спектрограмме на всем его протяжении. 

Локус, к которому стремится нижняя граница шума передне- 
язычно-небного ш, размещен в области 1300+200 Гц, т. е. пример- 
но там, где находится вторая форманта гласного а. Он размещен 
несколько ниже, чем в случае переднеязычно-зубного с. Поэтому 
характер коартикуляционных движений второй форманты в окру- 
жающих гласных является весьма надежным ключом к иденти- 
фикации согласно ш. На стыке ш с гласными у и о частота 
второй форманты этих гласных поднимается. В окружении глас- 
ных а частота 22 почти не изменяется. Зато в слоге ашА хорошо 
видно понижение частоты первой форманты, но этот эффект, как 
уже указывалось, присущ всем без исключения согласным-ртосмы- 
кателям. На фоне гласного а с его высоким положением Ё/ этот 
эффект особенно хорошо заметен. 

В слогах эшЭ и ышЫ видно понижение частоты второй фор- 
манты на границе с ш в стремлении к своему локусу. 

Следует обратить внимание на слог ишИ. Звук ш в русском 
языке при литературном произношении не смягчается. Это сопро- 
тивление палатализации можно видеть на динамической спектро- 
грамме слога ишИ. И-образная конфигурация артикуляционного 
тракта здесь нарушается на участке твердо произносимого №, 
и вторая форманта направляется к своему переднеязычному локу- 
су с тем, чтобы снова вернуться к и-образному положению в ко- 
нечном гласном. Полезно сравнить спектрограммы слогов ишИ 
и ис’И, где согласный с’ легко смягчается. 

Необходимо также отметить различительные признаки соглас- 
ного ш и ф. Их порой трудно найти в спектральной характеристи- 
ке турбулентного шума, который занимает примерно ту же спек- 
тральную область у обоих звуков. В словах, однако, интенсив- 
ность ш значительно больше, чем ф. Кроме того, особенно 
информативной является динамика хода второй форманты этих 
согласных на границе с гласными. На стыке с гласными у, о ча- 
стота Е2 всегда повышается в случае ш, тогда как в случае ф 
она сохраняет предельно низкие значения, характерные для губ- 
ной артикуляции. В случае слога афА Е2 четко понижается, чего 
не наблюдается в слоге ашА. На фоне гласных э и ы эти призна- 
ки теряют, однако, свою различительную информативность в силу 


55 





.7 С 





ИЗ 6 ЗОБ 0 216 


4 

Рнс. 3.3.7. Динамические спектрограммы переднеязычно-небного звонкого 

щелевого согласного ж в симметричиых слогах гласный — ж — гласный. 

Слева направо: верхний ряд — [ужУ], [ожО]; средиий — [ажА], [эжЭ}]; 
нижний — [ыжЫ], [ижИ]. 
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совпадения направления движения второй форманты. Но тогда 
разница в общей интенсивности шума позволяет принять правиль- 
иое решение о фонетической принадлежности произнесенного со- 
гласного. 


3.3.7. Переднеязычно-небный звонкий щелевой согласный ж 


Трудно прибавить что-либо существенное к характеристике 
звука ж, кроме того, что этот звук — звонкий двойник глухого 
щелевого согласного ш. Это хорошо видно на динамических 
спектрограммах (рис. 3.3.7). 

На всем протяжении согласного ж работают голосовые связки, 
поэтому и полоса фонации также видна на протяжении всего 
слога. 

Как и у всех звонких согласных, интенсивность шума ж су- 
щественно меньше, чем у глухого ш. Наиболее слабая турбулент- 
ность шума проявляется в случае окружения его открытыми 
гласными а в слоге ажА. Все остальные акустические ключевые 
признаки, характеризующие место образования звонкого щеле- 
вого ж, остаются такими же, как и у глухого щелевого ш, при- 
надлежащего к одной и той же переднеязычно-небной группе. 

Турбулентный шум занимает ту же спектральную область 
1000—5000 Гц; характер коартикуляционного влияния на вторую 
форманту окружающих гласных также сводится к ее устремлению 
к такому же частотному локусу, находящемуся вблизи форманты 
Е2 гласного звука а, т. е. 1300+200 Гц. Естественно, хорошо за- 
метно понижение частоты первой форманты в гласных на границе 
с согласным ж. 

Плохая смягчаемость ж в русской речи приводит к тому, что 
в слоге ижИ звук ж произносится недостаточно мягко, как бы 
сопротивляясь палатализации, так что нижняя граница шума на 
участке ж на динамической спектрограмме слога ижИ заметно 
опускается вниз. 


3.3.8. Переднеязычный боковой сонорный согласный л 


В образовании согласного л шум не принимает участия, он 
произносится исключительно с участием тонального источника 
и поэтому относится к группе сонорных согласных. 

По месту артикуляции этот звук достаточно вариативный. Его 
образование связано с прижатием кончика языка к твердому 
небу так, что, продвигаясь к открытому рту, воздух проходит 
через боковую часть ротовой полости. При форсированном про- 
изнесении л слегка вздуваются щеки у кончиков губ. Возбуждаю- 
щиеся при этом резонансные полосы проявляются на динамичес- 
ких спектрограммах. 

Место контакта языка с твердым небом у отдельных лиц и в 
разных случаях может меняться от точки у альвеол зубов до 
средней части твердого неба. Соответственно этому и частотный 
локус, к которому стремится вторая форманта звука л, может 
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Рис. 3.3.8. Динамические спектрограммы переднеязычного сонорного бо- 

кового согласного л в симметричиых слогах гласный — л — гласный. Сле- 

ва направо: верхний ряд — [улУ}, [олО]; средний — [алА], [зло]; ниж- 
иий — [ылЫ], [ил И]. 
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располагаться от низкой области, находящейся даже несколько 
ниже, чем в переднеязычно-небных звуках, таких как ш и ж, до 
весьма высоких значений, приближающихся к значениям перед- 
неязычно-зубных согласных є, 3, т, д, н. 

Обычно звук л классифицируют как переднеязычно-зубной 
звук, образующийся в месте соприкосновения кончика языка с зу- 
бами. В таком случае он ближе всего к носовому н и его отличие 
от последнего заключается в том, что воздушная струя направ- 
ляется не через носовую полость, а проходит по бокам языка, 
истекая через ротовое отверстие. 

Локализовать место образования л в русском языке следует 
в достаточно широкой области — от зубов до средней части твер- 
дого неба. В нашем материале звук л был произнесен в большей 
мере как переднеязычно-небный звук, в чем мы сможем убедиться, 
рассматривая динамические спектрограммы, приведенные на 
рис. 3.3.8. 

Что весьма характерно для бокового (латерального) л, — это 
большая подвижность его второй форманты, которая за время 
его произношения успевает, в основном, достичь своего частотного 
локуса, расположенного сравнительно низко, примерно в области, 
характерной для гласного о, что хорошо видно на спектрограмме 
слога олО. Это область частот порядка 1000 Гц, как правило, 
она несколько ниже, чем у остальных переднеязычно-небных зву- 
ков, таких как жи №. 

Звук л на динамических спектрограммах порой трудно отли- 
чить от носового сонорного н, близкого по месту артикуляции, 
особенно в Тех случаях, когда на спектрограммах проявляются 
дополнительные резонансные полосы, которые в верхнечастотной 
области бывают очень похожими. Достаточно характеристической 
отличительной чертой согласного л в этих случаях является по- 
движность его второй форманты. Действительно, вторая форманта 
не просто движется по направлению к своему локусу, но успевает 
достичь его номинального значения, расположенного вблизи 
1000 Гц. В слоге улУ это движение направлено вверх, в случае 
олО оно почти не изменяется. Чуть вниз направлена [2 в слоге 
алА и все больший размах получает нисходящее ее движение 
в слогах злд и ылЫ. 

Соответственно проявляются на границах с л коартикуляцион- 
ные эффекты на соседних гласных. Правда, сонорность звука л 
часто затрудняет установить точную границу окончания пред- 
шествующего гласного и начала л. Окончание же л порой отме- 
чено своеобразным щелчком (порождаемым отрывом кончика 
языка от неба), помогающим идентификации его на спектрограм- 
ме (см., например, слог улУ). Смягчаемость л в русском языке 
полная. На спектрограмме ил’И это очень хорошо видно, особен- 
но если сравнить эту спектрограмму с рядом расположенной 
спектрограммой слога ылЫ, где л твердое. В ил’И и-образная 
артикуляция, характерная для палатализованной модификации 
согласных, сохраняется на протяжении всего слога, в том числе 
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Рис. 3.3.9. Динамические спектрограммы переднеязычиого сонорного дро- 

жащего согласного р в симметричных слогах гласный — р — гласный. Сле- 

ва иаправо: верхний ряд — [урУ], [орој; средний — [арА], 5рЭ} нижиий — 
{ырЫ], [ир'И]. 












и на участке л. Вторая форманта здесь не движется вниз к перед- 
неязычно-небному локусу, а сохраняется в палатальном и-образ- 
ном положении, вследствие чего акустически реализуется мягкий 
согласный л’. 


3.3.9. Переднеязычно-небный 
дрожащий сонорный согласный р 


Специфической особенностью спектра дрожащего сонорного 
звука р являются периодические ослабления интенсивности основ- 
ного тона и формантной структуры звука. Они вызываются свое- 
образным дрожанием передней части языка в месте его контакта 
с небом. Контакт может тоже происходить на достаточно вариа- 
бельной по величине и локализации площади в средней части 
твердого неба, причем кончик языка несколько загибается вверх 
и как бы распластывается в месте контакта. 

Несмотря на некоторые отличия в степени напряжения языка, 
место его контакта с небом, а следовательно, фонетическое место 
артикуляции близко к таковому для всех остальных звуков перед- 
неязычно-небной группы. 

Как видно из приведенных динамических спектрограмм сим- 
метричных слогов гласный—р— гласный на рис. 3.3.9, движение 
второй форманты соответствует ее стремлению к частотному ло- 
кусу, близкому к значению Ё2 гласного а, т.е. 1000...1500 Гц. 
Поэтому коартикуляционное влияние звука р на окружающие его 
гласные таково, что на стыке р со звуками у и о форманта ЁЕ2 
повышается. На стыке со звуком а это повышение еле заметно. 
Зато на стыке согласного р с гласными э и ы частота второй 
форманты отчетливо понижается. 

Формантные полосы Ё/ и 22 видны на динамических спектро- 
граммах звука р не менее отчетливо, чем у звука л, а «дрожа- 
щий» характер этого звука является хорошим спектрографическим 
ключом для его идентификации при условии, что он произнесен 
фонетически правильно. В ряде случаев можно увидеть на спектро- 
грамме р и более высокие форманты. 

Эффект палатализации, приводящий к смягчению р в слоге 
ир’И, выражен достаточно четко в том смысле, что смягченный р” 
приобретает формантную структуру окружающих гласных и. Од- 
нако явление смягчения р’ сказывается заметно на интенсивности 
и выраженности «дрожания», поэтому идентификация мягкого р” 
на динамической спектрограмме часто затруднена. 


3.3.10. Переднеязычные смычно-щелевые 
согласные (аффрикаты) ци ч 


Аффрикаты характеризуются наличием глухой смычки, похо- 
жей на таковую у взрывных согласных, и щелевой фазы после 
смычки. Акустическая глухая смычка реализуется как пауза, хо- 
рошо заметная на динамической спектрограмме. Щелевая фаза 
реализуется как полоса высокочастотного шума. 
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Рис. 3.3.10. Динамические спектрограммы переднеязычных смычно-щеле- 


вых согласных (аффрикат) ц и ч в симметричных слогах [ацА] (слева) 
и [ачА] (справа). 


Шум в случае аффриката ц по всем спектральным характери- 
стикам сходен со спектром шума щелевого с вследствие одного 
и того же переднеязычно-зубного места образования. По той же 
причине и характер коартикуляционного влияния й на форманты 
окружающих гласных такой же, как и у звуков с и т, имеющих 
то же самое место артнкуляции. 

Шум переднеязычно-небного аффриката ч по спектральным 
характеристикам сходен с шумом переднеязычно-небного фрика- 
тивного согласного ш. По характеру коартикуляционного влияния 
на форманты окружающих гласных здесь имеет значение тот 
факт, что согласный ч в литературном русском языке обычно яв- 
ляется смягченным. Это означает, что на переднеязычно-небную 
артикуляцию у него накладывается дополнительная палатальная 
артикуляция. При произношении аффриката ч степень палатали- 
зации у непрофессиональных дикторов может варьировать в до- 
статочно широких пределах. 

На рис. 3.3.10 слева приведена спектрограмма слога ацА, 
а справа — слога ачА. В отличие от остального материала, эти 
спектрограммы были сняты в несколько другом масштабе, огра- 
ниченном частотным диапазоном 5 кГц. На спектрограммах хоро- 
шо видна фаза смычки и фаза шума обоих аффрикатов. Так же 
четко выражено движение формант у последующих гласных. 

Что касается щелевого согласного 4, который является, в сущ- 
ности, слитно произнесенным сочетанием согласных ш и +, то 
спектрограммы этого звука будут нами рассмотрены в последую- 
щих главах. 
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3.4. ДИНАМИЧЕСКИЕ СПЕКТРОГРАММЫ СРЕДНЕЯЗЫЧНЫХ 
И ЗАДНЕЯЗЫЧНЫХ СОГЛАСНЫХ 


К группе среднеязычных согласных в русском языке относится 
только один звук й. Группа заднеязычных согласных более много- 
численная и включает в себя взрывные звуки к, г и щелевой х. 


3.4.1. Среднеязычно-средненебный сонорный 
щелевой согласный й 


Звук й образуется активным сближением средней части языка 
к средней части твердого неба, оставляя между ними проход 
наподобие щели. Поэтому в классификационной таблице звук 
й определяют как среднеязычно-средненебный щелевой сонорный 
согласный. Образованный активным движением средней части 
тела языка к средней части твердого неба, звук й является истин- 
но палатальным звуком и его влияние на окружающие звуки 
неразрывно связано с палатализацией последних. 

На рис. 3.4.1 звук й представлен тремя динамическими спектро- 
граммами слогов /йУ, ой0 и айА. Из спектрограмм видно, что 
этот звук являет собой как бы произнесенный с напряжением 
гласный звук и. По положению формант ЁРІ и Е2 согласный й 
и гласный и занимают близкое положение; у й вторая форманта 
занимает крайне высокое положение, где она расположена выше 
2,4—2,5 кГц. Отчетливо проявляются у й форманты более высо- 
ких порядков в виде четких резонансных полос. Звук й хорошо 
взаимодействует с соседними гласными; эффект коартикуляции 
проявляется в виде движения формант в окружающих гласных 
по направлению к специфическим частотным локусам этого звука. 


3.4.2. Заднеязычно-небный глухой взрывной согласный к 


Все заднеязычные согласные к, г, х образуются задней частью 
языка как активным органом. Обычно в классификационных таб- 
лицах их относят к заднеязычно-задненебным звукам, подчеркивая 
тем самым место контакта языка с небом при их образовании. 
Тем не менее, спектральные исследования показывают, что место 
контакта корня языка с небом не только очень сильно изменяется 
в разных вариантах произношения этих звуков, но в такой же сте- 
пени зависит от окружающих звуков речи, в частности гласных. 
Поэтому контакт корня языка с небом как бы приспосабливается 
к месту образования близлежащих гласных, захватывая большие 
расстояния по площади, что существенно отражается на формант- 
ных характеристиках названных согласных, вследствии чего эта 
интересная группа звуков характеризуется своеобразными аку- 
стическими признаками на динамических спектрограммах. 

При образовании всех заднеязычных согласных источник шума 
расположен за ротовым резонатором. Это влияет на характер 
генерируемого шума, который приобретает своеобразный аспи- 
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Рис. 3.4.1. Динамические спектрограммы среднеязычно-средненебного сонорного 
щелевого согласного й в симметричных слогах гласный — # — гласный. Сверху 
вниз — [уйУ], [ойО], [айА]. 


ративный, придыхательный оттенок, концентрируя свою энергию 
в низкочастотной части. Вследствие ограниченности подвижности 
корня языка по сравнению с губами или кончиком языка взрыв 
у заднеязычного к растянут и напоминает скорее аффрикат, чем 
взрывной импульсный звук. 

На рис. 3.4.2 приведена серия слогов гласный—к— гласный 
в окружении симметричных гласных. Глухой тип этого звука от- 
ражается в наличии акустической паузы в его начальной фазе. 
Аффрикатизация взрыва у заднеязычного к видна отчетливо на 
всех приведенных спектрограммах, так как фаза взрыва сильно 
растянута во времени и проявляет турбулентные свойства. 

На спектрограммах хорошо видна указанная выше характер- 
ная особенность к как представителя заднеязычных звуков. Она 
состоит в коартикуляционной приспособляемости его места арти- 
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Рис. 3.4.9. Динамические спектрограммы заднеязычно-небного глухого взрыв- 

ного согласного к в симметричных слогах гласный — к — гласный. Слева 

направо: верхний ряд — [укУ}, [ок]; средний — [акА], [кој нижний — [ыкЫ}, 
Гик’ИІ. 


куляции к окружающим гласным звукам. Окружающие гласные 
со сложившимся у них укладом формантной картины диктуют 
место заднеязычного взрыва у этого согласного и, следовательно, 
его акустические спектральные характеристики. Так, шум взрыва 
к в слоге укУ расположен вблизи формант гласного и, в слоге 
окО — в области формант гласного о, в слоге акА — в области 
формант гласного а, в слоге экЭ — в области формант гласного 
э, а в слоге ыкЫ — вблизи формант гласного ы. В слоге ик’И 
шум взрыва смягченного к’ смещается в район гласного и и при- 
обретает отчетливо заметный палатализованный характер. Следу- 
ет также обратить внимание на постепенную смягчаемость к уже 
в слогах экЭ и ыкЫ. 

Очень интересная особенность всех заднеязычных согласных 
состоит в том, что по мере возрастания частоты второй форманты 
по ряду у—и у окружающих гласных увеличивается интенсив- 
ность и длительность шума согласных с одновременным смеще- 
нием спектра в высокочастотную область. В слоге ик'И, на- 
пример, иногда бывает трудно отличить высокочастотный шум, 
образованный заднеязычной артикуляцией, от такого же высоко- 
частотного шума, образованного переднеязычной артикуляцией. 


3.4.3. Заднеязычно-небный звонкий взрывной согласный г 


Акустическое отличие звонкого г от глухого к заключается 
прежде всего в том, что глухая смычка здесь заменяется фона- 
цией, проявляющейся на динамической спектрограмме в виде по- 
лосы основного тона. | 

Взрывная часть у г короче, кроме того, интенсивность взрыва 
заметно меньше, чем у к. В остальном же к иг ведут себя в сло- 
гах гласный—согласный—гласный одинаково. Место их артику- 
ляции, а следовательно, спектральное положение взрыва соот- 
ветствует по частоте формантным областям окружающих глас- 
ных — первых двух формант в слогах угУ, огО, агА, а также 
к более высоким формантам в слогах 323, ыгЫ, иг’И. В трех 
последних слогах г постепенно палатализуется, что заметно на 
соответствующих спектрограммах, а в случае иг’И палатализация 
г полная, и весь слог сохраняет типичную для эффекта смягчения 
и-образную конфигурацию формант. Описанные явления иллю- 
стрированы динамическими спектрограммами симметричных сло- 
гов гласный—г— гласный на рис. 3.4.3. 


3.4.4. Заднеязычно-небный глухой щелевой согласный х 


Динамические спектрограммы этого звука в симметричных 
слогах гласный —х— гласный приведены на рис. 3.4.4. 

Все то, что было скрыто под акустической паузой в фазе 
смычки взрывного к, становится видимым в шумной фазе глухого 
щелевого х. Глухой взрывной к — это как бы резко укороченный 
щелевой х. Аналогично взрывной т можно образовать резким 
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Рис. 3.4.3. Динамические спектрограммы заднеязычно-небного звонкого 

взрывного согласного г в симметричных слогах гласный — г — гласный. Сле- 

ва направо: верхний ряд — [угУ], [огој средний — [агА], [эгЭ]; нижний — 
[ыгЫ} [иг'И]. 


67 





З. р 1 отт т тај 
ФЗ ОК а они 07212 ОУ 6.790 


Рис. 3.4.4. Динамические спектрограммы заднеязычно-небного глухого ше- 

левого согласного х в симметричных слогах гласный — х — гласный. Слева 

направо: верхний ряд — [уху], [охО]; средний — [ахА], [эхЭ]; нижний — [ыхЫ], 
[их И] 
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Рис. 3.4.5. Динамические спектрограммы заднеязычно-небного звонкого 


щелевого согласного П в симметрических слогах [аһА} (слева) и [Ава] 
(справа). 





укорочением щелевого с, а взрывной п — укорочением щелевого 
ф. Опыты такого рода неоднократно проводились в эксперимен- 
тально-фонетических лабораториях и подтвердили значимость 
восприятия места образования согласных. 

В окружении гласных заднего ряда у, о, а в шуме щелевого х 
преобладает аспиративный источник. Он, как правило, узкополос- 
ный, сконцентрированный в области первой и, особенно, второй 
формант. Динамика движения второй форманты здесь как бы 
экспонирована в узкой полосе шума согласного х и показывает 
приспособление его артикуляции к соседним гласным. 

По мере продвижения окружающих гласных фонетическим 
рядом от и до и шум щелевого х постепенно сдвигается по спектру 
в высокочастотную область, где размещены форманты более вы- 
соких порядков. Одновременно увеличивается ширина спектраль- 
ной области шума, который все более приобретает турбулентный, 
фрикативный характер. При этом низкочастотная, аспиративная 
часть шума, близкая к области первой форманты, постепенно ис- 
чезает, и в этой области образуется антирезонанс. 

Произнесение мягкого х в слоге их И, в котором сохраняется 
на протяжении всего слога и-образная конфигурация формант, 
обладает столь мощным фрикативным высокочастотным шу- 
мом, что этот слог почти невозможно отличить от слога ис’И, 
образованного другим, переднеязычным артикуляционным движе- 
нием в сочетании с дополнительной палатализацией. 

Щелевые заднеязычные звуки интересны еще одной характер- 
ной особенностью. В тех случаях, когда указанные звуки обра- 
зуются при помощи заднеязычно-задненебной артикуляции, а это 
происходит при их окружении гласными заднего ряда у, о, 2, 
сужение в речевом тракте образуется при их артикуляции пре- 
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дельно далеко сзади. В таких случаях произношение данных со- 
гласных не сопровождается понижением частоты первой форман- 
ты, что хорошо заметно в слоге ахА. Еще лучше виден этот 
своеобразный эффект, если щелевой заднеязычный согласный 
типа х вокализован. 

В русском литературном произношении звонкой пары глухому 
щелевому х не существует. Тем не менее звонкий щелевой звук й 
зачастую проникает в русскую разговорную речь из украинского 
языка, где он является полноправным звуком системы украинских 
согласных. 

На рис. 3.4.5 приведена динамическая спектрограмма слогов 
аһА и Айа, отличающихся местом ударения, где символ й обо- 
значает звонкий вариант заднеязычно-задненебного щелевого со- 
гласного. Масштаб приводимых спектрограмм несколько изменен; 
они сняты в Частотном диапазоне до 5 кГц. На спектрограммах 
указанных слогов видно, что основная энергия у звука Й скон- 
центрирована вблизи формант окружающих гласных а и что по- 
нижения частоты первой форманты при его произношении прак- 
тически не происходит. Четко выражена только вокализация этого 
звука. 


3.5. ДИНАМИЧЕСКИЕ СПЕКТРОГРАММЫ МЯГКИХ СОГЛАСНЫХ 
И ЭФФЕКТ ПАЛАТАЛИЗАЦИИ 


В русской фонетике почти у всех согласных противопоставлены 
их твердые и мягкие варианты произношения, выполняющие ис- 
тинные фонемные функции в языке. Мягкие варианты одного 
и того же согласного образуются за счет наложения на его соб- 
ственную артикуляцню дополнительной артикуляции мягкости, 
которая изменяет характер места образования звука, превращая 
его в палатализованный звук. 

Артикуляция мягкости заключается в том, что наряду с основ- 
ным сближением каких-либо речевых органов (губ, языка) с зу- 
бами или небом, одновременно приподнимается к небу средне- 
передняя часть языка. Эта дополнительная среднеязычно-небная 
артикуляция и создает при восприятии впечатление мягкости со- 
гласного и называется палатализацией согласного. С позиции 
спектральной динамики палатализация сводится к подчеркнутой 
и-образной и даже й-образной артикуляции смягчаемого соглас- 
ного. В тех случаях, когда мягкий согласный произносится в сло- 
гах типа гласный—согласный—гласный, #-образная артикуляция 
распространяется и на окружающие гласные, создавая на дина- 
мических спектрограммах очень характерные коартикуляционные 
эффекты. 

В предыдущих параграфах мы ознакомились с симметричны- 
ми слогами, в которые входили разные согласные русского языка. 
Последним слогом в каждой из приведенных серий спектрограмм 
выступал слог и—согласный—И. Во всех этих слогах согласные 
лодвергались дополнительной палатализации и превращались 
в мягкие варианты соответствующих согласных звуков. 
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Рис. 3.5.1. Динамические спектрограммы мягких согласных в симметрич- 
ных слогах гласный-—согласный—гласный., Слева направо: верхннй 
ряд — [аз’А], [ас’У]; средний — [аб’А], [ах’У]; ннжний [ат'А], [атО]. 
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В настоящем разделе на рис. 3.5.1 приводятся дополнительные 
примеры динамических спектрограмм мягких согласных в несим- 
метричных слогах для разных фонетических классов русских со- 
гласных. Это следующие слоги: аз'А, ас’У, аб'А, ахУ, атА и 
ап’О. На приведенных примерах можно увидеть следующую ха- 
рактерную особенность произношения мягких согласных. Допол- 
нительная палатальная артикуляция начинается еще в предшест- 
вующем гласном. Это коартикуляционное движение хорошо замет- 
но на спектрограммах в конце предшествующего гласного в виде 
начального повышения 22. В результате выполнения палатального 
жеста конфигурация рта приводится в и-подобное или й-подобное 
положение с предельно высоким значением частоты второй фор- 
манты. Весьма показательно, что в этом положении артикуля- 
ционные органы активно удерживаются почти до самого конца 
согласного и освобождаются от него только в момент начала 
последующего гласного. Удивительно, насколько однообразен ме- 
ханизм образования мягких согласных и как упорно он проявля- 
ется при произношении всех групп согласных. Специально прове- 
денные исследования эффекта палатализации показали высокую 
статистическую достоверность того значения, которое занимает 
временная динамика формант в восприятии мягкости согласных. 

Когда после мягкого согласного следует гласный заднего ряда 
у, о или а, то в начальной части гласного на динамической 
спектрограмме наблюдаются мощные и-образные переходы фор- 
мант, которые служат надежными идентификаторами мягкости 
предшествующих согласных и являются одним из наиболее по- 
лезных ключевых признаков в процессе чтения динамических 
спектрограмм не только слогов, но также слов и предложений. 


ГЛАВА У 


ДИНАМИЧЕСКИЕ СПЕКТРОГРАММЫ 
ИЗОЛИРОВАННО ПРОИЗНЕСЕННЫХ СЛОВ 


4.1. РАЗНООБРАЗИЕ РЕАЛИЗАЦИЙ ФОНЕМ В СЛОВАХ. 
ВЗАИМООТНОШЕНИЕ МЕЖДУ ОРФОГРАФИЧЕСКОЙ ЗАПИСЬЮ 
И АКУСТИКО-ФОНЕТИЧЕСКОЙ РЕАЛИЗАЦИЕЙ ЗВУКОВ 


До тех пор пока мы ограничивались рассмотрением бессмыс- 
ленных слогов, звуковые реализации фонем достаточно хорошо 
выявляли свои спектрально-временные ключи, их статику и дина- 
мику, поскольку на протяжении изолированно произносимого слога 
достаточно времени для проявления характерных свойств отдель- 
ных звуков. 

Переход от слогов к словам ставит нас перед фактом не- 
сравненно большего разнообразия реализаций звуков речи, чем 
номинальное количество фонем — их наиболее типичных предста- 
вителей *. В словах реальной речи гласные и согласные появля- 
ются в ударных, предударных и заударных слогах на разных 
расстояниях от ударного слога. Кроме того, слова, даже если они 
произнесены изолированно, а тем более в слитной естественной 
речи, артикулируются быстрее, чем бессмысленные слоги, а сле- 
довательно, укорачивается время для формирования отдельных 
звуков речи. Это приводит к сокращению стационарных участков 
звука, смещению их частотных характеристик, в связи с чем 
уменьшается роль статических характеристик звуков речи в сло- 
вах. Наряду с этим возрастает роль взаимодействия акустических 
признаков отдельных звуков в процессе формирования слов, уве- 
личивается значение динамики спектрально-временного отобра- 
жения артикуляционных жестов в условиях реального времени, 
предоставленного для их исполнения. 

Объем книги не позволяет нам рассматривать и документиро- 
вать все разнообразие слов, где отдельные звуки выступают как 
в ударных, так и в безударных слогах, анализировать сочетания 
звуков в их бесчисленных комбинациях. Да в этом и нет необхо- 
димости. Мы отметим здесь только то, что уже в наиболее простых 
изолированно произнесенных словах те спектрально-временные 
ключи, которые мы можем сравнительно легко обнаружить в сло- 


* Определение фонем как типичных представителей звуков речи, которые 
реализуются вне многочисленных реальных взаимных влияний, не отражает 
всех сторон учения о фонеме как основном объекте фонологии и теоретической 
лингвистнки. Оно ограничивается обобщением только на акустическом уровне, 
рассматривая фонему как наиболее инвариантный эталон звуков речи данного 
языка. А; 
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гах гласный—согласный—гласный, выступают далеко не всегда 
отчетливо. Признаки способа и места образования согласиых, 
отражаемые в динамике их спектра, формантные характеристики 
гласных — все они заметно усложняются за счет увеличения их 
вариабельности. Характерные признаки звуков речи то исчезают, 
то появляются не там, где их следовало бы ожидать, или изме- 
няются по временным и частотным параметрам. В этой главе мы 
рассматриваем такие явления, как коартикуляция звуков в сло- 
вах, редукция отдельных фонетических признаков, оглушение 
звонких согласных, придание звонкости глухим, а также другие 
виды взаимодействия звуков, усложняющие «чтение» динамиче- 
ских спектрограмм слов. 

Другая сложность, которую необходимо преодолеть на стадии 
анализа динамических спектрограмм слов, заключается в том, 
что слово произносится не так, как оно пишется. Понимание 
этого факта является первым элементом тех фонетических знаний, 
какие должен усвоить человек, начинающий работать с речевым 
сигналом. Буквенное написание звуков речи в текстах и звуковое 
представление слов в их акустической динамике не совпадают 
друг с другом, а являются разными средствами символики языка 
с достаточно сложиыми взаимоотношениями. То, что буквы и вы- 
ражаемые ими звуки однозначно не совпадают, отнюдь не озна- 
чает, что их взаимоотношения не поддаются формализации, а до- 
ступны лишь интуиции человека, овладевшего данным языком. 
Плодотворные работы по алгоритмизации преобразования русских 
орфографических текстов в фонетическую запись ведутся во мно- 
гих фонетических школах [17]. Наша задача в этой главе состоит 
в том, чтобы предоставить в распоряжение читателя объективную 
документацию таких взаимоотношений в виде динамических 
спектрограмм слов. 

Фонетическую реализацию фонем в словах и текстах можно 
описывать с большей или меньшей подробностью, а следователь- 
но, вводить в алфавит фонетических транскрибантов большее или 
меньшее количество знаков, уточняющих реализацию каждой 
данной фонемы в зависимости от ее близости к ближайшим или 
более отдаленным соседям, от ударения, темпа речи, слитности 
произношения и т. п. Наиболее полной в этом отношении является 
международная фонетическая транскрипция, представляющая 
собой важный инструмент фонетического анализа языков. В тра- 
диционных фонетических исследованиях для фонетической тран- 
скрипции звуков речи используются знаки латинского алфавита, 
дополненные вспомагательными буквенными и специальными обо- 
значениями [16]. Мы не ставим, однако, задачи углубляться в де- 
тали проблемы фонетической транскрипции — одной из актуаль- 
ных проблем теоретической и прикладной фонетики. Главная наша 
цель заключается в том, чтобы подчеркнуть многообразность 
звуковых реализаций в реальных высказываниях. Имея в распо- 
ряжении однозначно транскрибируемые звуки речи в словах, 
у читателя могло бы сложиться впечатление о незыблемости тех 
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реализаций фонем (фонетических вариантов), которые предписы- 
ваются литературной нормой произношения. 

На самом деле это не так. Естественная речь чрезвычайно 
вариативна, даже если она не выходит за пределы литературной 
нормы. Разнообразие звуковых реализаций фонем в словах во 
многом определяется взаимными коартикуляционными эффектами, 
перекрыванием на оси времени артикуляционных жестов. Темп 
речи, вносящий индивидуальные и в каждом отдельном случае 
непредсказуемые влияния на глубину коартикуляционных взаимо- 
действий, флуктуации акустической энергии, с которыми произ- 
носится речевое высказывание, индивидуально различная инерци- 
онность артикуляционного аппарата — эти, а также другие 
аиатомические, физиологические и психологические различия по- 
рождают изменчивость реализаций фонем в натуральной речи. 

Принципиальную сторону соответствия между буквами напи- 
санного и звуками произнесенного и представленного на динами- 
ческой спектрограмме слова можно отобразить, пользуясь наи- 
более прозрачной системой фонемной транскрипции слов, 
примененной в настоящей книге. На материале динамических 
спектрограмм этой главы читатель сможет убедиться, что звуко- 
вые реализации фонем в словах многообразны, но не хаотичны, 
часто непредсказуемы во всех деталях, но сохраняющие необхо- 
димые ключевые признаки, позволяющие слушателю произвести 
соответствующую дешифровку и осмысленно воспринять структу- 
ру слова в целом. 

Для того чтобы четко разграничить буквенную запись и звуко- 
вую реализацию’ слов, мы будем при дальнейшем изложении 
материала заключать орфографические записи букв, слов и тек- 
стов в кавычки (например «я», «мама»), а фонемы и их после- 
довательности в словах будут печататься курсивом (а, п’ат’). 
Наконец, в тех случаях, когда будет необходимо конкретизиро- 
вать частную реализацию какого-либо звука в слове, соответству- 
ющий символ этого звука будет заключаться в квадратные скобки. 

В приложении в алфавитном порядке приводится фонемная 
транскрипция всех слов, динамические спектрограммы которых 
рассматриваются в отдельных главах. Как правило, слова в тек- 
сте приводятся в буквенной транскрипции. В подписях к рисун- 
кам дана упрощенная фонетическая транскрипция слов, макси- 
мально приближающаяся к фонемной транскрипции. В ней отра- 
жены, в частности, факты редукции безударных гласных в твер- 
дых (символ [ъ]) и мягких (символ [ь]) позициях. 


4.2. ДИНАМИЧЕСКИЕ СПЕКТРОГРАММЫ ПРОСТЫХ СЛОВ 
ДЕТСКОГО БУКВАРЯ 


В этом разделе представлены динамические спектрограммы 
наиболее простых слов, которые первыми входят в мир ребенка, 
овладевающего родной речью. Они взяты из лексикона «Азбуки», 
выдержавшей более десяти изданий, для обучения детей в семье 
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(6). Слова состоят из одного, двух или трех слогов и подобраны 
так, чтобы соответствующие звуки, на которых фиксируется вни- 
мание читателя, находились под ударением. Слова приведены 
согласно русского алфавита от «А» до «Я». 

Наша задача будет состоять в том, чтобы увидеть наиболее 
информативные акустические явления, которые визуализируются 
на динамических спектрограммах, делая доступным глазу то, что 
воспринимает ухо, научиться находить в динамических спектрах 
слов входящие в их состав звуки речи и их рудименты. Кроме 
номинально озаглавленных звуков в ударных слогах, мы будем 
комментировать большинство других звуков, входящих в слова. 

«А». На рис. 4.2.1. приведены динамические спектрограммы 
слова «каша», «майка», «час» и «чай». В этих словах в ударном 
слоге выступают звуковые реализации фонемы а. Динамика фо- 
немной картины гласной а в указанных реализациях достаточно 
отличается друг от друга, отражая специфику коартикуляции 
с окружающими согласными. Наименьшее влияние окружающих 
звуков на ударное [а] имеет место в слове «каша». Расположен- 
ный по оси времени слева от [а] велярный артикуляционный жест, 
порождающий начальный согласный [к], практически не оказыва- 
ет влияния на типичное расположение формант у последующего 
[а], а сменяющий его справа переднеязычный жест, при помощи 
которого образуется согласный [ш], лишь немного смещает часто- 
ту второй форманты вверх в конце гласного. 

Наиболее мощное коартикуляционное влияние на гласные 
звуки оказывает палатальный жест, при участии которого обра- 
зуются все мягкие согласные. В слове «майка» он расположен 
справа от ударного [а], за которым следует согласный [И]. На 
спектрограмме видно, как губной тип коартикуляции, обусловлен- 
ный начальным согласным [м], удерживающим вторую форманту 
[а] в ее нижних частотных пределах, непосредственно без какой- 
либо фиксации стационарного участка переходит в палатальный 
жест, стремясь к предельно высокочастотному положению второй 
форманты. 

В слове «час» звук [а] несет слева отпечаток предшествующе- 
го палатального жеста, связанного с произнесением мягкого со- 
гласного [ч], в силу чего в нем реализуется иа-образная динами- 
ка движения формант. 

Наконец, в слове «чай» на гласный [а] действует двухсторон- 
няя палатализация, обусловленная мягкими согласными [ч] (сле- 
ва) и [й] (справа). В условиях двустороннего смягчения глас- 
ный [а], даже будучи в ударной позиции, не успевает обрести 
своей характерной формантной картины. Проявляя И-образные 
тенденции слева и справа, звук [а] в этой позиции даже в своей 
срединной части имеет заниженные значения первой форманты и 
завышение—второй, напоминая скорее гласную э, чем а. Слух 
человека фиксирует специфику фонемного тембра гласного в 
окружении мягких согласных. Если вырезать на сепараторе 
средний участок гласного [а] из слова «чай», то при прослуши- 
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Рис. 4.2.1. Слева направо: динамические спектрограммы слов [кАшај, 
[мАйка] — верхний ряд; [чАс], [ЧАЙ] — нижний, в которых выступают фоне- 
тически различные реализации фонемы а. Ударный гласный отмечен большой 

буквой. 


вании он будет звучать в полном согласии со своей формантной 
картиной как звук э. Учет формантной динамики в целом слове и 
осмысленный анализ вызвавших ее причин вносят необходимые 
коррективы, позволяющие человеку правильно воспринять слово 
в целом и восстановить его фонемный состав. 

Рассматривая динамические спектрограммы слов, приведенных 
на рис. 4.2.1, следует обратить внимание на то, что гласные 
в ударной позиции выражены более отчетливо, чем безударные, 
в данном случае — заударные гласные. Они прежде всего длиннее 
безударных, а также обладают большей общей интенсивностью, по- 
зволяющей лучше рассмотреть на спектрограммах их акустические 
детали. Однако вследствие того, что чувствительность уха более 
высока, чем разрешающая способность электрочувствительной 
бумаги сонографа, некоторые невидимые на сонограмме детали 
тем не менее могут фиксироваться при слуховом восприятии и вы- 
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полнять различающую функцию. Мы будем встречаться с подоб- 
ными явлениями при обсуждении взрывных согласных, а также 
редуцированных гласных в безударных позициях. Что касается 
согласных, выступающих в словах, приведенных на рис. 4.2.1, то 
их спектрально-временные ключи выражены достаточно отчетливо. 
Это согласные [к] и [ш] в слове «каша», хорошо контрастирующие 
по длительности и спектральной характеристике шума, равно как 
и согласные [4] и [с] в слове «час». 

На сегменте согласного [м] в слове «майка» заметны носовые 
форманты. По характерному расположению формант легко иден- 
тифицировать согласный [И] в словах «чай» и «майка». В послед- 
нем слове хорошо также проявляется акустическая пауза и аф- 
фрикатизованный взрыв на интервале реализации согласного [к]. 

«Б». Буква «б» употребляется в русском языке для обозначе- 
ния двух согласных фонем — твердого 6 и мягкого 6’. Слова «ба- 
бушка» и «белка», в которых они реализуются, приведены в верх- 
нем ряду на рис. 4.2.2. В слове «бабушка» звук [6] встречается 
два раза — в ударном и безударном слогах. Хорошо видна в обоих 
случаях полоса основного тона — признак звонкости согласного. 
Взрыв в согласном [6], как правило, выражен слабо, но так или 
иначе на спектрограмме можно установить его низкочастотную 
локализацию. Это видно по восходящему движению второй фор- 
манты в слогах [ба] и особенно [бу], свидетельствующему о губном 
характере взрыва в твердом согласном [6]. 

Палатализация мягкого [6’] резко сказывается на частотной ло- 
кализации его взрыва, который расположен в области второй 
форманты гласной и. Отсюда мягкому [6'] сопутствует и-образное 
расположение формант в последующем гласном, что хорошо вид- 
но на спектрограмме слова «белка». В приведенных спектрограм- 
мах отчетливо проявляются характерные признаки согласных [ш] 
и [к].Особенно следует обратить внимание на динамику движения 
второй форманты на участке звукосочетания [6'зл]. Формантная 
картина ударного гласного [э] в начале существенно смещена в и- 
образную область вследствие влияния левого палатального жеста, 
обусловленного мягким [6']. Справа он оказывается под воздей- 
ствием глубокого переднеязычного жеста, подготавливающего ре- 
ализацию твердого согласного [л], что обусловливает мощное ни- 
сходящее движение второй форманты, распространяющееся дале- 
ко за пределы частотной области, характерной для э. Начало 
согласного [л] на спектрограмме можно локализовать вблизи за- 
метного уменьшения интенсивности сигнала в области второй 
форманты. 

«В». В среднем ряду рис. 4.2.2 приведены динамические спект- 
рограммы слов «Иван» и «вижу». В первом примере заметна 
реализация лабиального жеста, обусловленного произнесением 
твердого губного согласного [в]. Он затрагивает конечную часть 
предударного гласного [и], в которой видно начинающееся пони- 
жение второй форманты. Последнее разворачивается в согласном 
[в] вплоть до начала ударного [а], в котором отчетливо видно вли- 
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Рис. 4.2.2. Слева направо: динамические спектрограммы слов [бАбушка] 


[6'Элка] — верхний ряд; [ивАн], [в’Ижу] — средний; [гАлка], [г’инАдий] 28 
нижний, в которых представлены звуковые реализации фонем 6, б’, в, в’ г, г’ 
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яние слева губного жеста. На интервале согласного [в] видна 
полоса основного тоиа — признак звонкости; шумная составляю- 
щая у [в] по причине ее малой общей интенсивности часто бывает 
еле заметной на спектрограмме, поэтому звук в порой бывает 
трудно отличить от других сонорных согласных. В приведенном 
примере в слове «Иван» согласный [в] имеет достаточно хорошо 
выраженные спектрально-временные ключи. Желательно обратить 
внимание также на появление неподвижных носовых формант на 
участке реализации звука [н]. 

Мягкий согласный [в] в слове «вижу» реализуется на фоне 
и-образной конфигурации полостей артикуляционного аппарата, 
о чем свидетельствует частотная локализация шумовой части 
этого звонкого щелевого согласного, сосредоточенная в области 
второй форманты гласной и и выше. Обладающий признаком 
звонкости — иаличием основной частоты — мягкий согласный [в’] 
плавно переходит в гласный [и], с которым его объединяет общий 
признак палатальной артикуляции. В конце гласного [и] заметно 
влияние на него правой переднеязычной коартикуляции, вызван- 
ной согласным [ж] с его четко выраженными спектрально-времен- 
ными ключами. 

«Г». На динамической спектрограмме слова «галка» твердый 
звонкий взрывной согласный [г] противопоставлен глухому [к], 
с которым его объединяет способ и место образования. Звонкая 
смычка у [г] и отсутствие таковой у [к] хорошо видны на спектро- 
грамме этого слова. Согласный [л] можно локализовать по замет- 
ному ослаблению формантной структуры сигнала, свидетельствую- 
щей об окончании ударного гласного [а]. Его формантная струк- 
тура выражена здесь неотчетливо, однако с уверенностью можно 
установить факт сонорности по наличии на интервале звука [л] 
полосы основного тона. 

На динамической спектрограмме слова «Геннадий» локализа- 
ция взрыва мягкого [г] в области второй форманты последующего 
гласного [и] является свидетельством мягкости данного звонкого 
взрывного согласного. Но этого часто бывает недостаточно для 
уверенного различения на динамических спектрограммах мягких 
звонких взрывных согласных 6’, 0’, г’. Трудно, например, найти 
на спектрограмме рассматриваемого слова различительные при- 
знаки мягкого [д’] в конечном заударном слоге, кроме наличия 
звонкой смычки и факта мягкости, о котором свидетельствует 
динамика второй форманты в предшествующем и последующем 
гласных. Слабо выражены также носовые форманты в удлинен- 
ном согласном [н], где их можно заметить только на стыках с со- 
седними гласными. Необходимо обратить внимание на коарти- 
куляционные влияния в гласных. Так, в ударном [а] четко выра- 
жена его правая палатализация, обусловленная последующим 
мягким [д’], а предударный гласный [и], более короткий, испыты- 
вает влияние левого палатального и правого переднеязычного 
жестов, что заставляет его резлизвватоя в непрерывном движе- 
нии формант. 
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«Д». Твердый переднеязычный согласный [д] показан на дина- 
мической спектрограмме слова «Даша». В верхнем ряду рис. 4.2.3 
хорошо видна начальная звонкая смычка и короткий широко- 
полосный взрыв, спектральный локус которого расположен не- 
сколько выше частоты второй форманты последующего гласного 
[а], что отражается на коартикуляционном движении второй фор- 
манты начальной части этого гласного. Ему противопоставляется 
мягкий согласный [д’]. В его образовании доминирующую роль 
играет палатальный жест, вследствие чего спектральный локус 
взрывного сегмента сдвинут в высокочастотную область. Это 
представлено на участке звука [д’] слова «Дима». Спектрограмма 
здесь расположена справа в верхнем ряду того же рисунка. 
В ударном слоге согласный [д’] часто проявляет тенденцию к аф- 
фрикатизации, т.е. к удлинению фазы взрыва, что облегчает его 
идентификацию на спектрограмме. Это бывает, однако, не всегда, 
особенно если звук [д выступает в безударном слоге, в чем мы 
могли убедиться на примере слова «Геннадий». Соседство с мяг- 
ким согласным делает формантную картину начальной части глас- 
ной [и] особенно четкой, способствуя стационарости ее проявле- 
ния. Одновременно с этим на участке ударного [и] в слове «Дима» 
хорошо проявляется эффект его правой лабиализации, приводя- 
щий к резкому понижению частоты второй форманты в конце 
гласного [и] вследствие формирования губного жеста для про- 
изнесения последующего согласного [м]. На интервале последнего 
заметны неподвижные носовые форманты. 

«Е». На динамической спектрограмме слова «ела», приведен- 
ной в среднем ряду на рис. 4.2.3, видно, что буквой «е» обозна- 
чается сочетание звуков [й]-+ [э]. Поскольку согласный й является 
мягким, гласный э в сочетании с ним всегда находится в условии 
левой палатализации. Это представлено на спектрограмме слова 
«ела». Звук [й] с отчетливой шумовой составляющей (ее выра- 
женность может сильно варьировать) плавно переходит в гласный 
[9], который по положению формант явно начинается с и-образной 
позиции. На всем протяжении гласного [э], несмотря на то, что 
он находится в ударной позиции, трудно найти стационарный 
участок. Причина в том, что справа он подвергается влиянию пе- 
реднеязычного жеста, связанного с произнесением последующего 
твердого [л]. Мы уже встречались с подобными явлениями на 
примере слова «белка» (см. рис. 4.2.2). Форманты гласного [3] 
непрерывно движутся от й-образного положения и, не останавли- 
ваясь в э-образной конфигурации, продолжают движение к перед- 
неязычному локусу, характерному для [л]. Реализуя звук [л], фор- 
манты устремляются к положению, характерному для гласного 
[ај, который в слове находится в конечном положении. Сегмент, 
отвечающий согласному [л], можно найти на спектрограмме по 
ослабевающему следу второй форманты. 

В слове «дети» гласный [3] реализуется с двусторонней пала- 
тализацией. Слева она обусловлена произнесением мягкого [д'], 
а справа — мягкого [т]. Двусторонняя палатализация практически 
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Рис. 4.2.3. Слева направо: динамические спектрограммы слов [дАша], 

[д’Има] — верхний ряд; [ИЗлај, [д’Эт’и] — средний; [йОжык], [т’От’а]— ниж- 

ний, в которых выступают звуковые реализации фонем 0, д’ и звукосоче- 
таний йэ и йо. 
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не разрешает звуку [3] реализовать свою формантную картину, 
которая удерживается на всем его протяжении близкой к фонем- 
ному образу [и]. На спектрограмме слова «дети» необходимо об- 
ратить внимание также на аффрикатизацию мягких взрывных 
согласных. Она хорошо выражена в фазе взрыва согласного [д’] 
в начальном ударном слоге. Глухие взрывные согласные еще боль- 
ше аффрикатизируются при смягчении, что проявляется в соглас- 
ном [т] в конечном безударном слоге. 

«Ё». Этим буквенным символам обозначается сочетание звуков 
[#]-+ [0]. В нижнем ряду на рис. 4.2.3 приведены динамические 
спектрограммы слов «ёжик» и «тётя», в которых реализуются зву- 
ковые явления, орфографически обозначаемые символом «ё». 
В слове «ёжик» после легко идентифицируемого звука [И] на- 
ступает мощное нисходящее движение второй форманты в на- 
чальной части ударного гласного [0], отображающее факт его ле- 
вой палатализации. Подчеркнуто отчетливое произнесение слова 
«ежик» дало возможность ударному гласному [0] в этой конкрет- 
ной ситуации достичь стационарного участка и зафиксировать 
характерное для фонемы о положение формант, невзирая на по- 
следующее влияние правого переднеязычного жеста, вызванного 
реализацией согласного [ж]. Если же мягкие согласные будут 
окружать звук [0] с обеих сторон, а темп речи будет близкий 
к естественному, то на картине движения формант в гласном [0] 
скажется дефицит времени его реализации. 

Именно такой случай отображен на динамической спектро- 
грамме слова «тета», приведенной справа в нижнем ряду того же 
рисунка. Это слово вырезано из высказывания «Тётя Надя поила 
телят», произнесенного в естественном темпе, поэтому время, 
занимаемое ударным [0] в слове «тётя», втрое меньше, чем в сло- 
ве «ёжик». Двусторонняя палатальная коартикуляция не позво- 
ляет фонеме о в слове «тётя» реализовать свою представительную 
формантную картину и на спектрограмме отражена только ми- 
молетная тенденция к понижению второй форманты, удерживае- 
мая справа и слева палатальными жестами, обусловленными про- 
изнесением мягких согласных [т']. 

Следует обратить внимание, что убыстрение темпа речи зна- 
чительно менее отразилось на длительности взрывных фаз соглас- 
ных [т] по сравнению с влиянием на длительность гласных. На 
спектрограмме слова «тётя» видна также аффрикатизация взрыва 
как первого, так и второго мягкого согласного [т’]. Хочется также 
обратить внимание на реализацию заударного гласного в слове 
«ёжик», который представлен согласно с литературной нормой 
русского произношения звуком [ы], поскольку предшествующий 
ему согласный [ж] является твердым. Этот факт хорошо отражен 
в частотном положении второй форманты следующего за [ж] глас- 
ного, которая в своей начальной части не поднимается выше 
1500 Гц. 

На рис. 4.2.4 приводятся динамические спектрограммы слов, 
в которых реализуются согласные [ж], [3] и гласный [и]. 


83 


84 








ї 0 " алзы тарга. рае, 
С. 17 ель (у. ИИО 67 С 


Рис. 4.2.4. Слева направо: динамические спектрограммы слов [жАба) 
[жЫл’и] — верхний ряд; [зОйа], [3'Ина] — средний; [Ира], [учИт'] — нижний, 
в которых встречаются звуковые реализации согласных ж, з, 3 и гласной и. 
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«Ж». В верхнем ряду приведены спектрограммы слов «жаба» 
и «жили». Звук [ж] в обоих случаях выявляет свои характерные 
признаки способа и места образования — наличие полосы основ- 
ного тона и характерное частотное положение достаточно длитель- 
ной и интенсивной полосы фрикативного шума. Необходимо отме- 
тить, что согласный [ж] реализуется в русской литературной речи 
исключительно твердо, так что нижняя граница его шума лежит 
выше области второй форманты гласного [а]. Это хорошо видно 
на спектрограмме слова «жаба». Важным следствием несмягчае- 
мости согласного [ж] является принципиальная невозможность 
реализации вслед за ним гласного [и]. Следуя законам русской 
литературной речи, в этом случае реализуется гласный [ы], что 
можно видеть на интервале его реализации в спектрограмме сло- 
ва «жили». 

Характерным отличием гласного [ы] является его дифтонго- 
идный характер, когда в начальной части гласного вторая фор- 
манта стартует с довольно низким, порядка 1500—1800 Гц, 
значением, постепенно повышаясь вплоть до реализации типичной 
и-образной формантной картины. Мы обсудим примеры реали- 
зации звука [ы] в словах дальше, обратив внимание на факт 
левого «твердого влияния» в ударном гласном слова «жили», что 
дает основание утверждать: здесь мы имеем дело с реализацией 
фонемы [ы] после твердого [ж]. В слове «жили» так же четко 
прослеживается факт правой палатализации гласного [ы], обуслов- 
ленный последующим мягким [л’]. Следует обратить внимание, 
что вторая форманта в мягком [л'] расположена в области пала- 
тального локуса, характерного для гласного и и остается в этом 
положении вплоть до реализации конечного гласного [и]. 

«З». Буквой «з» обозначается в русской речи твердый соглас- 
ный [3] и мягкий согласный [з’], спектральные характеристики 
которых показаны на примере слов «Зоя» и «Зина» в среднем 
ряду рис. 4.2.4. Видно, что согласные [з] и [3'] характеризуются 
наличием признака звонкости — полосой основного тона, а также 
хорошо выраженной полосой высокочастотного шума. Степень 
смягчения звука [3'] может быть различной; она зависит от степени 
выраженности палатального жеста, с которым коартикулирует 
этот звук по причине самостоятельно выраженной мягкости или 
в силу близости с гласным [и]. Об этом можно судить по поло- 
жению второй форманты на интервале согласного [3], однако 
последняя часто бывает слабо выраженной, и тогда единственным 
критерием мягкости согласного [3’] является характер движения 
второй форманты на границе с последующим гласным. 

В слове «Зоя» тип левой коартикуляции гласного [0] с соглас- 
ным [3] несомненно указывает на переднеязычный характер обу- 
словленного им артикуляционного жеста, а следовательно — на 
твердость согласного [3]. Он резко контрастирует с правым пала- 
тальным влиянием последующего мягкого [й]. В слове «Зина» 
степень смягчения [3'] достаточно большая, что видно по высокому 
расположению частоты второй форманты на стыке [3’] и после- 
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дующего [и]. Смягчение [3’] реализуется неодномоментно, а раз- 
вертывается во времени по мере подъема частоты #2 на протя- 
жении целого слога. Легко представить себе еще более высокую 
степень смягчения [37], когда вторая форманта в самом его начале 
поднята до крайне высоких значений порядка 2500 Гц. Подобные 
градации смягчения мы встретим при обсуждении согласного [с’]. 

«И». Спектрограммы слов, в которых встречается гласный [иј, 
приведены в нижнем ряду рис. 4.2.4. Фонема и может реализо- 
ваться или в начале слова, как в слове «Ира», или после мягкого 
согласного, как в слове «учить». Реализация твердого согласного 
перед гласным типа и неминуемо смещает вниз его вторую фор- 
манту. Если факт твердого левого влияния произойдет на интер- 
вале гласного, то он будет реализован как фонема ы. Если же 
взаимные влияния согласного и гласного закончатся на интер- 
вале реализации согласного и его формантная картина успеет при- 
йти в и-образное положение, то завершится процесс смягчения 
согласного, и последующий гласный будет реализован как фонема 
и. Мы встречались с превращениями типа [ы] — [и] по причине 
разной смягчаемости согласных в словах «жили» и «Зина». 

Если фонологические правила не позволяют в русской лите- 
ратурной речи появиться фонеме и с левой твердой коартикуля- ' 
цией, то ничто не мешает ей нести на себе отпечаток влияния 
правых артикуляционных жестов *. Спектрограмма слова «Ира» 
демонстрирует мощное влияние правого переднеязычного жеста, 
обусловленного последующим звуком [р], на спектральную картину 
гласного [и]. Естественно, что формантная картина гласного [и] 
наиболее близко подходит к своему идеальному фонемному этало- 
ну, если она поддерживается справа и слева мягкими согласными, 
что можно видеть на примере спектрограммы слова «учить». На 
этой спектрограмме желательно обратить также внимание на ре- 
ализацию мягкости аффриката [ч], состоящего из короткой паузы 
и растянутого во времени взрыва, частотная характеристика шу- 
мовой части которого выдает наличие эффекта палатализации. 
Конечный мягкий глухой взрывной [т] в этом слове отличается 
чересчур подчеркнутой аффрикатизацией. 

«Й». Звук [И] уже рассматривался в спектрограммах слов 
«ела» и «ежик», где он входил в начальную часть комплексов 
«е» и «6». В верхнем ряду рис. 4.2.5 приведена спектрограмма 
слова «лужайка», в котором звук [й] расположен в средине слова. 
Согласный [И] хорошо выделяется после ударного гласного [а], 
коартикулируя с ним и заставляя форманты [а] двигаться по на- 
правлению к характерному для [И] палатальному положению, от- 
личающемуся предельно высоким значением Р2. Звук [И], как пра- 
вило, слабее гласного [а], и это тоже заметно на спектрограмме. 
Освобождение речевого тракта от палатальной артикуляции, обу- 
словленной звуком [И], осуществляется в течение глухой смычки 


* Следует указать, что выделение самостоятельной фонемы ы признается 


ие всеми фонологическими школами. ‘ г 
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Рис. 4.2.5. Слева направо: динамические спектрограммы слов [лужАйка], 
(салав' НИ] — верхний ряд; [кОшка], [угал'к'И] — средний, [лАмпај, [ил’Уша] — 
нижний, в которых выступают звуковые реализации согласных й, к, к’, л, л". 
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последующего согласного [к]. Взрывная часть согласного [к] при- 
урочена к месту второй форманты последующего [а]. В началь- 
ной части слова слог [лу] можно разделить на участки [л] и [у], но 
отличия между ними проявляются на спектрограмме довольно 
слабо. В гласном [у] лучше, чем у [л], видна формантная струк- 
тура. Что касается звонкого щелевого [ж], то он сохраняет все 
свои отличительные признаки. Следует обратить внимание на 
конечную часть гласного [у], в которой проявляется правое коар- 
тикуляционное влияние переднеязычного [ж], заставляющее вто- 
рую форманту повышаться к своему частотному локусу. 

Другой пример согласного [й] приведен на динамической 
спектрограмме слова «соловьи», где его подчеркнутое произноше- 
ние в ударном слоге отражается в возникновении на спектро- 
грамме высокочастотных составляющих. В эгом слове проявляет- 
ся динамика постепенно нарастающей мощной палатализации 
звуков, которая начинается посредине безударного слога [ла] 
и продолжается до конца слова. Дополнительные примеры реали- 
зации согласного [И] можно найти на спектрограммах слов «Ми- 
хаил», «Николай» (рис. 4.5.3) и др. 

«К». В среднем ряду рис. 4.2.5 приводятся динамические 
спектрограммы слов «кошка» и «угольки», в которых в ударных 
позициях реализуются твердый согласный [к] и мягкий согласный 
[к’]. В слове «кошка» содержатся два звука [к]. На спектрограмме 
хорошо видно соответствие частоты взрыва звука [к] частотной 
локализации второй форманты последующего гласного. Глухой 
взрыв твердого [к], в отличие от [п] и [т], отчетливо аффрикатизо- 
ван, его узкополосность обусловлена в значительной мере аспи- 
ративным характером образуемого шума. Мягкий согласный [к'] 
характеризуется сильно аффрикатизованным высокочастотным 
взрывом, резко отличающимся по спектру от такого у твердого [к]. 
На обеих спектрограммах четко выражена глухая смычка, являю- 
щаяся неотъемлемой фазой временной Динамики всех глухих 
взрывных согласных. Хорошо проявляются также ключевые при- 
знаки всех остальных звуков. Следует обратить внимание на 
резкую правую палатализацию предударного гласного [а] в слове 
«угольки», обусловленную последующим мягким согласным [л’]. 

«Л». Динамические спектрограммы слов, в которых выступают 
твердый согласный [л] и мягкий согласный [л’], приведены в ниж- 
нем ряду на рис. 4.2.5. Это слова «лампа» и «Ильюша», где 
указанные звуки находятся в начале слова в ударных позициях. 

В слове «лампа» звук [л] проявляет свои спектральные особен- 
ности способа и места образования. Как сонорный звук [л] ха- 
рактеризуется обязательным наличием полосы основного тона на 
спектрограмме. Движение второй форманты отображает место 
образования твердого [л], имеющего частотный локус несколько 
ниже частоты Ё2 гласного [а], ближе к области второй форманты 
гласного [0]. Звук [л] иногда бывает трудно идентифицировать на 
спектрограммах слов, особенно в начале слова. В данном случае 
его спектр довольно близок со спектром согласного [в]. Подобные 
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неоднозначности при попытке идентифицировать звуки речи на 
спектрограммах встречаются весьма часто. Это следует иметь 
в виду, приобретая опыт чтения динамических спектрограмм. 

Остальные звуки в слове «лампа» выражены на спектрограмме 
достаточно отчетливо. Видна носовая резонансная полоса соглас- 
ного [м], глухая смычка и низкочастотный взрыв у взрывного [п], 
а также соответствующая локализация формант в ударном и ко- 
нечном безударном гласных [а]. 

Мягкий согласный [л’] на спектрограмме слова «Ильюша» су- 
щественно отличается от твердого [л] высоким расположением 
полосы второй форманты. Порой, однако, бывает трудно уверенно 
установить временные границы звуков [л] и [л7, когда они грани- 
чат с гласными. Следует обратить внимание на резко выражен- 
ный эффект левой палатализации ударного гласного [уј, обуслов- 
ленный предшествующим мягким согласным [л']. 

Хорошие дополнительные примеры лабильности второй 
форманты согласного [л] читатель может найти на спектрограммах 
слов «Михаил» и «Николай», приведенных на рис. 4.5.3. 

«М». Характерной чертой твердого [м] и мягкого [м’] является 
наличие у этих согласных носовых резонансных полос, которые 
в большинстве случаев видны на динамических спектрограммах 
слов и существенно помогают в их идентификации. Они четко 
проявляются на спектрограммах слов «мама» и «Миша», которые 
приведены в верхнем ряду рис. 4.2.6. 

Усиление носовых резонансных полос, обусловленных свобод- 
ным прохождением воздуха через нос при закрытии полости рта, 
сопровождается демпфированием истинных ротовых формант, не- 
сущих информацию о динамике артикуляционных жестов, в част- 
ности тех, которые вызывают или подавляют палатализацию. 
Поэтому на интервале носовых согласных на динамической 
спектрограмме практически нельзя увидеть движения второй фор- 
манты, а следовательно, информацию о твердости—мягкости зву- 
ков [м] и [м’] (а также [н] и [н']) необходимо искать на стыках 
с окружающими гласными. В слове «мама» следует обратить вни- 
мание на то, что левая и правая лабиальная коартикуляция удар- 
ного гласного [а] с окружающими твердыми согласными {м} предо- 
храняет вторую форманту от интенсивных движений, а это спо- 
собствует проявлению в гласном хорошо видимого стационарного 
участка с почти идеальным положением формантной картины 
фонемы а. В слове «Миша» отчетливо проявляется коартикуля- 
ционное влияние правого переднеязычного жеста на форманты 
ударного гласного [и], резко сдвигающего в его конечной части 
вторую форманту вниз по направлению к переднеязычному локусу 
последующего [ш]. 

«Н». В словах «нос» и «нёс», приведенных в среднем ряду 
рис. 4.2.6, удобно проследить те спектрально-временные ключи, 
которыми различаются твердое [н] и мягкое [н"]. В обоих случаях 
имеет место признак сонорности — наличие полосы основного тона. 
Носовые форманты проявляются на спектрограмме менее отчет- 
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Рис. 4.2.6. Слева направо: динамические спектрограммы слов [мАма], 

[м’Иша] — верхний ряд; [нОсј, [н’Ос] — средний; [Осы], [стОй] — нижний, 

в которых выступают звуковые реализации согласных м. м’, н, н и глас- 
НОЙ 0. 
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ливо, чем в случае [м] и, как правило, в конце согласного, но они 
могут экспонироваться и в начальной части последующего глас- 
ного, что помогает идентификации носовых согласных, но может 
усложнить частотную локализацию истинных ротовых формант 
на участке гласного. Ключевым признаком, позволяющим отли- 
чить твердое [н] от мягкого [н’], является мощная левая палаталь- 
ная коартикуляция ударного гласного [0], следующего за мягким 
согласным [н’], тогда как левая переднеязычная коартикуляция 
того же гласного с предшествующим твердым [н] не идет ни в ка- 
кое сравнение по степени влияния на вторую форманту последую- 
щего гласного. 

«О». Типичная формантная картина этого гласного приведена 
в нижнем ряду рис. 4.2.6 на спектрограмме слова «осы». Справа 
на нее оказывает влияние переднеязычный жест, вызванный по- 
следующим согласным [с]. Подобную картину мы уже видели. на 
спектрограмме слова «нос», хотя она была усложнена наложением 
носовой форманты в первой половине ударного гласного. Насколь- 
ко более существенно влияние палатального жеста на динамику 
формант гласного [0] показано на спектрограмме слова «стой», 
где ударный гласный [0] реализован в условиях правой палатали- 
зации. Картину левой палатализации гласного [0] мы видели на 
примере слова «нёс», а с двусторонней палатализацией этого 
гласного встречались при обсуждении спектрограммы слова «тётя» 
(см. рис. 4.2.3). 

Все остальные звуки на спектрограммах слов, приведенных 
на рис. 4.2.6, имеют хорошо выраженные спектрально-временные 
признаки, не требующие дополнительных комментариев. 

«П». Естественно привести в качестве представительного слова 
для звука [п] динамическую спектрограмму слова «папа». В верх- 
нем ряду рис. 4.2.7 на спектрограмме этого слова не видно взрыв- 
ной фазы звука [п], так как его идентификация прежде всего 
основана на установлении факта глухой смычки и на отображении 
характерных для класса губных согласных коартикуляционных 
явлений в окружающих гласных. Сам взрыв [п] настолько слабый, 
что остается незаметным на спектрограмме как в ударном, так 
и в безударном слогах. 

Место образования твердого согласного [п] отражается на 
огублении левого и правого стыков этого согласного с гласными 
[а]. Как и в случае слова «мама», произнесение слова «папа» 
неизбежно требует смыкания губ, а это четко отражается на ходе 
формант в гласных [а]: вторая форманта на стыке с губным [п] 
как в фазе смычки, так и в фазе взрыва понижается к более 
низкочастотному лабиальному локусу. 

Фаза взрывного мягкого [п'] может быть несколько удлинена, 
что позволяет увидеть в ней факт палатализации этого взрывного 
согласного. Сказанное заметно на примере спектрограммы слова 
«пели», где взрыв мягкого [п’] локализован в области второй 
форманты последующего и-образного гласного. Желательно об- 
ратить внимание на то, что ударный гласный [э] палатализуется 
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Рис. 4.27. Слева направо: динамические спектрограммы слов [пАпај], 
[п'Эл'и] — верхиий ряд; [рОмај, [р’Ита] — средний; [сАшај, [с'Итај — нижний, 


в которых выступают звуковые реализации согласных и. п’, р, р', с, С. 
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в слове «пели» слева и справа, в силу чего на всем протяжении 
в нем реализуется типичная и-образная формантная картина. 

«Р». В среднем ряду рис. 4.2.7 на спектрограмме слова «Рома» 
приведен пример реализации согласного [р]. Этот звук, в случае 
фонетически четкого произношения, образуется с характерным 
дрожанием кончика языка, что отражается на спектрограмме 
в виде специфической прерывистости сигнала по всему спектру. 
Звук [р] может иметь разную интенсивность и длительность, 
в том числе и разную длительность участков вокализации вплоть 
до ее отсутствия. Это очень сильно затрудняет идентификацию 
звука [р], вокализованные участки которого можно легко принять 
за безударные гласные, а глухие участки — за редуцированные 
глухие согласные. В ряде случаев трудно с уверенностью указать 
на спектрограмме конец дрожащего [р] и начало последующего 
гласного. На спектрограмме слова «Рома» начало последующего 
гласного [0] удается локализовать достаточно уверенно. Надо от- 
метить, что [р] как переднеязычный звук оказывает соответству- 
ющее коартикуляционное влияние на форманты последующего 
гласного [0]. 

В согласном [р] хорошо просматривается частотное положение 
второй форманты. Вследствие этого сравнительно легко заметить 
факт палатализации согласного. На спектрограмме слова «Рита» 
видно, как нарастает во времени степень смягчения мягкого со- 
гласного [р’] при приближении к мягкому ударному гласному [н]. 

«С». Твердый согласный [с] типично реализован в слове «Са- 
ша», приведенном в нижнем ряду рис. 4.2.7, где он контрастирует 
с согласным [ш]. На динамической спектрограмме на интервале 
глухого щелевого [с] редко удается увидеть события, разверты- 
вающиеся в диапазоне частот второй форманты: их интенсивность 
подавлена наличием в этой области у [с] антирезонанса. О твер- 
дости согласного [с] в слове «Саша» можно, однако, с уверен- 
ностью судить по отсутствию левой палатальной коартикуляции 
у последующего гласного [а]. У мягкого [с’] на спектрограмме 
часто можно заметить след второй форманты в виде узкой полосы 
шума; в таких случаях (см. спектрограмму слова «сито») свиде- 
тельство мягкости согласного [с] очевидно. Но даже в случае 
отсутствия видимого следа второй форманты на интервале этого 
щелевого согласного о его мягкости можно судить по частотному 
положению второй форманты в начале последующего гласного. 

«Т». На рис. 4.2.8 в верхнем ряду приведены динамические 
спектрограммы слов «фонтан» и «Катюша». Твердый согласный 
[т] представлен в слове «фонтан» в ударном слоге в середине сло- 
ва. Его идентифицирующие ключи — глухая смычка перед взры- 
вом, сравнительно более высокочастотное положение самого взры- 
ва (по сравнению с губным [п|) и переднеязычный тип коарти- 
куляционного влияния на направление движения формант в 
последующем гласном — выражены на спектрограмме вполне от- 
четливо. В слове «Катюша» мягкий согласный [т’] обладает зна- 
чительной аффрикатизацией, видна приуроченность спектра взры- 


93 





= ч БР : Е. 0-2% —= 
я 5 7 © 3 27 Ф 567 про 
Рис. 4.2.8. Слева направо: динамические спектрограммы слов [фантАн}, 


[кат'Ушка] — верхний ряд; [шУра], [учУ] — средний, [фАбр'икај, [$' Ил ин] — 
нижний, в которых выступают звуковые реализации фонем т, т’, у, ф, $’. 
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ва к области максимально высокого расположения второй фор- 
манты, характерного для и-образного начала последующего 
гласного. В свою очередь динамика движения второй форманты 
последующего ударного гласного [у] отражает факт его левой 
палатализации мягким согласным [т’]. 

Интересно сравнить на спектрограммах обоих слов спектраль- 
ные характеристики согласных [ф] и [ш], довольно близких по 
спектру шума, но различных по его интенсивности. Хорошо выра- 
жены характерные признаки носового согласного [н] в слове 
«фонтан». И первый и второй звук [н] в этом слове удается на- 
дежно локализовать на фоне предшествующих гласных по ухуд- 
шению формантной структуры, так что на участке [н] остается 
только полоса основного тона, а в его начальной части, на стыке 
с гласным — свойственная для согласного [н] полоса носовой фор- 
манты. 

«У». Гласный [у] в слове «Шура» (средний ряд рис. 4.2.8) 
представлен реализацией, на которой слева и справа оказывают 
коартикуляционное влияние соседние переднеязычные согласные. 
В силу этого на обоих краях ударного [У] наблюдаются повыше- 
ния второй форманты в направлении переднеязычных частотных 
локусов. Тем не менее длительность ударного [У] достаточно 
большая, чтобы достичь характерного для фонемы у стационар- 
ного участка с низким компактным расположением первой и вто- 
рой формант. 

Значительно более динамичны реализации гласного [у], на 
которые оказывают влияния палатальные жесты. Интересна в этом 
отношении спектрограмма слова «учу», где мягкий согласный [ч] 
оказывает палатальное влияние на предударный гласный [у] спра- 
ва, и одновременно производит еще более мощные палатальные 
воздействия слева на последующий ударный гласный [у]. Полная 
динамика движения второй форманты на протяжении слова «учу» 
скрыта частично на интервале акустической паузы согласного [ч]. 
Глубокие эффекты палатализации гласного [у] мы еще встретим 
при обсуждении акустических явлений, обозначаемых буквой «10». 
Мы хотим также обратить внимание на хорошую выраженность 
звука [р] в слове «Шура», а также на отличия в спектре шума 
звуков [ш] и [ч]. Принципиальная мягкость фонемы ч в рус- 
ской литературной речи приводит к тому, что нижняя граница 
у этого согласного всегда расположена выше, чем у [ш], не опус- 
каясь ниже второй форманты гласной и. Это хорошо видно при 
сопоставлении спектрограмм слов «Шура» и «учу». 

«Ф». Если сопоставить динамические спектрограммы слов 
«фабрика» и «филин», приведенных в нижнем ряду рис. 4.2.8 
(а также слово «фонтан» в его верхнем ряду), то станут очевид- 
ными различительные ключи звуков [ф] и [ф']. Слабый широко- 
полосный фрикативный шум твердого [ф] часто еле виден на спек- 
трограмме при недостаточном усилении сигнала, заметно отли- 
чается от хорошо выраженного по интенсивности шума мягкого 
(фу, у которого нижняя граница шума явно смещена вверх по 
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частотной шкале и напоминает шумовую часть аффриката [ч]. 
В слове «фабрика» отдельные звуки выражены на спектрограмме 
вполне отчетливо, однако надо обратить внимание на отсутствие 
характерной прерывистости в звуке [р], которая была так хорошо 
выражена в слове «Шура». На спектрограмме слова «филин» весь- 
ма характерно проявляется носовая форманта конечного [н|, за- 
хватывающая также вторую половину предшествующего гласно- 
го [и]. 

«Х». Твердый согласный [х] и мягкий согласный [х] высту- 
пают в словах «хата» и «чехи», динамические спектрограммы 
которых приведены в верхнем ряду рис. 4.2.9. Для твердого [х] 
характерна узкая полоса аспиративного шума, частотно приуро- 
ченного к частоте второй форманты последующего гласного. Ве- 
лярный жест, как правило, не смещает активно положения фор- 
мант в соседних звуках. Мягкий [х’] существенно отличается от 
твердого [х] по своей спектральной характеристике. На примере 
слова «чехи» видно, насколько увеличивается общая интенсивность 
шума мягкого [х’], а также его высокочастотное расположение в 
спектре. Мягкий согласный [х’] очень близко напоминает мягкий 
согласный [ф'], его можно спутать также с мягкими [с] и [4], осо- 
бенно в начале слова, что затрудняет его идентификацию на спек- 
трограммах слов. На спектрограмме слова «чехи» следует обратить 
внимание также на двустороннюю палатализацию ударного глас- 
ного [9] окружающими его мягкими согласными [ч] и [х'], вслед- 
ствие чего, в данном случае в звуке [3], реализуется и-образнал 
формантная картина. 

«Ц». Примеры слов с аффрикатом [ц] приведены в средней 
части рис. 4.2.9. Аффрикат [ц] в слове «лицо» имеет все отличи- 
тельные признаки переднеязычного глухого щелевого согласного, 
начальная часть которого заменена акустической паузой. Коарти- 
куляционное влияние на движение второй форманты у последую- 
щего гласного [0] по типу переднеязычной артикуляции, харак- 
терный высокочастотный спектр хорошо выраженного шума и от- 
четливо выраженная глухая смычка позволяют легко идентифи- 
цировать звук [ц] на спектрограмме. В литературной русской речи 
согласный [ц] произносится исключительно твердо. Это хорошо 
наблюдать при сопоставлении согласных [с’] и [ц] на динамиче- 
ческой спектрограмме слова «синица», анализируя частотное по- 
ложение и временную динамику формантных следов на интервале 
слогов, в состав которых входят данные согласные. 

«Ч». Спектральную характеристику звука [4] мы наблюдали 
в слове «чехи» в верхнем ряду рис. 4.2.9, где этот согласный, бу- 
дучи в начальной позиции в слове, не связан с необходимостью 
осуществления акустической паузы начальной части своей реали- 
зации. В нижнем ряду того же рисунка приведены спектрограммы 
слов «очи» и «очаг», где начальная пауза является необходимым 
атрибутом согласного [ч]. Аффрикат [ч] произносится согласно 
русской литературной нормы исключительно мягко. Степень этого 
смягчения может быть различной, но во всех случаях мягкий 
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Рис. 4.2.9. Слева направо: динамические спектрограммы слов [ХхАтај, 
[чЭх'и] — верхний ряд; [тицој [син'Ицај — средний; [Очи], [ачАк] — нижний, 
в которых выступают звуковые реализации согласных х, х, ци ч. 
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Рис. 4.2.10. Слева направо: динамические спектрограммы слов [шУра], 
[шалАш] — верхний ряд; [ш’Ука], [л’иш’И] — нижний, в которых выступают 
звуковые реализацин согласной ш и сочетания шч[ш’]. 


согласный [ч] оказывает типичное палатальное коартикуляцион- 
ное влияние на окружающие гласные, что хорошо видно на при- 
веденных спектрограммах. Следует обратить внимание на высоко 
расположенную нижнюю границу шума — характерный признак 
большинства мягких согласных. Целесообразно отметить также 
факт оглушения звонкого согласного [г] в конце слова, который 
произносится как глухой согласный [к]. Явление оглушения звон- 
ких согласных будет обсуждено нами далее. 

«Ш». В верхнем ряду рис. 4.2.10 приведены спектрограммы 
слов «Шура» и «шалаш», в которых отображены реализации со- 
гласного [ш], всегда выступающего в твердой позиции. Его соб- 
ственные спектральные характеристики. а также переднеязычный 
тип коартикуляции с соседними гласными проявляются в этих 
примерах очень наглядно. Хорошо выражены на спектрограммах 
также спектрально-временные. характеристики согласных [л] и [р]. 
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Рис. 4.2.11. Слева направо: динамические спектрограммы слов [шарЫ], 
{<Ын] — верхний ряд; [цЭх], [шЭст] — нижний, в которых выступают зву- 
ковые реализации гласных ы и 3. 


«Щ». Звуковой комплекс, обозначаемый буквой «щ», не яв- 
ляется простой суммой звуков [ш] и [ч]|, что демонстрируют 
примеры динамических спектрограмм слов «щука» и «лещи», при- 
веденных в нижнем ряду (рис. 4.2.10). В шумовой части этого 
комплекса отражена тенденция к слиянию его обоих звуковых 
компонентов, в силу чего исчезает глухая смычка аффриката [ч]; 
заполняясь непрерывным шумом. Важно отметить в комплексе 
«щ» доминирование палатализованного шумового компонента. 
В современном русском литературном произношении звуковой 
комплекс «щ» произносится как удлиненный мягкий щелевой со- 
гласный [ш’]. Эта тенденция к объединению и смягчению звуко- 
вого комплекса «щ» хорошо проявляется на спектрограммах ука- 
занных слов в виде непрерывного широкополосного шума со 
смещенной вверх нижней границей. 

«Ы». Гласный звук [ы] в словах сохраняет характерный диф- 
тонгообразный вид. Он начинается с положения, характерного 
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для ы, а затем его форманты сдвигаются в область фонемы и. 
Этот плавно повышающийся ход второй форманты является ха- 
рактерной особенностью произношения гласного [ы], обусловлен- 
ной необходимой твердостью предшествующего согласного и одно- 
временно подчеркивающей твердость его собственного произноше- 
ния. В верхнем ряду (рис. 4.2.11) на примере спектрограммы 
слова «шары», в котором гласный [ы| находится в конечном 
ударном положении, проявляется дифтонгообразный характер 
этого гласного звука. Характерная динамика второй форманты, 
стремящейся к повышению своей частоты, сохраняется даже тог- 
да, когда звук [ы] подвергается правому воздействию последую- 
щего артикуляционного жеста, понижающего ее частоту. Приме- 
ром сказанного может служить спектрограмма слова «сын», в ко- 
тором на ударный гласный [ы] в его конечной части воздействует 
правая переднеязычная коартикуляция, обусловленная последую- 
щим согласным [н]. 

«Э». Примеры звуковых реализаций фонемы э приведены в 
нижнем ряду рис. 4.2.11. На динамической спектрограмме слова 
«цех» влияние на гласный [э] левого переднеязычного и правого 
велярного артикуляционных жестов минимально, так что его фор- 
мантный паттерн, особенно в срединном стационарном участке, 
приближается к идеальному фонемному эталону. На спектрограм- 
ме слова «шесть» реализация гласного [э] подвержена правому 
палатальному влиянию, сдвигающему его форманту по направле- 
нию к и-образному положению. На приведенных спектрограммах 
полезно также сопоставить спектральные характеристики глухих 
щелевых согласных [х], [ш], [с] и аффрикат [д] и [т]. 

С примерами левого смягчения гласного [3] мы уже знакоми- 
лись, анализируя слова «белка» (рис. 4.2.2.) и «ела» (рис. 4.2.3), 
а в словах «дети» (рис. 4.2.3), «пели» (рис. 4.2.7) и «чехи» 
(рис. 4.2.9} мы наблюдали, как действующая слева и справа па- 
латальная коартикуляция удерживает реализацию звука [3] в 
и-образном положении на всем протяжении его звучания. 

«Ю». Буквой «ю» орфографически обозначается звуковой ком- 
плекс [#] + [у]. На динамической спектрограмме слова «Юра» 
видны оба компонента этого комплекса. Звук [И] менее интен- 
сивный, но палатальная конфигурация его формант проявляется 
как в нем самом, так и, особенно отчетливо, в начальной части 
гласного [у], где осуществляется освобождение речевого тракта 
от левой палатальной коартикуляции со звуком [И]. Справа на 
участке гласного [у] хорошо выражен правый переднеязычный 
жест, обусловленный последующим гласным [р] с его характерно 
выраженной прерывистостью. В том же верхнем ряду (рис. 4.2.12) 
рядом со словом «Юра» приведена динамическая спектрограмма 
слова «рисую». На ней интересно прослеживается мощная дина- 
мика движения второй форманты от огубления в гласном [у] до 
предельно высокой палатализации в согласном [И]. Видно, как 
палатальный согласный [И] оказывает и правое, и левое коарти- 
куляционное влияние на окружающие гласные в сочетании [уйу]. 
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Рис. 4.2.12. Слева направо: динамические спектрограммы слов [#Ура], 
[р'исУйу] — верхний ряд; [ААгады], [#Амы] — нижний, в которых выступают 
звуковые комплексы йу и йа. 


«Я». Звуковой комплекс [И] + [а] в слове «ягоды» произнесен 
с подчеркнутым ударением, в силу чего на сегменте звука [И] 
видны высокочастотные шумовые составляющие, обычно отсут- 
ствующие в более естественно произносимых словах. Как в этом 
слове, так и в слове «ямы», произнесенном другим диктором (ди- 
намические спектры обоих слов показаны в нижнем ряду 
рис. 4.2.12), отчетливо проявляется левый палатальный артику- 
ляционный жест в начальной части гласного [а]. В слове «ямы» 
можно заметить также правое лабиальное влияние на ударный 
гласный [ај последующего губного [м], на участке которого про- 
являются носовые форманты, а также отчетливую дифтонгоид- 
ность конечного гласного [ы]. 

«Ъ» и «Ь». Твердый и мягкий знаки, не имея собственного 
звукового значения, являются антагонистами в том плане, что 
первый подчеркивает твердость предшествующего согласного, 
а второй его мягкость. На рис. 4.2.13 в верхнем ряду противопо- 
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Рис. 4.2.13. Слева направо: динамические спектрограммы слов [с'Эл], [сйЭл]-- 
верхний ряд; [Ус], [Ос] — нижний, в которых демонстрируется эффект аку- 
стической реализации твердости и мигкости согласных. 


ставляются спектрограммы слов «сел» и «съел». В слове «сел» 
мягкий согласный [с’] оказывает типичный эффект левой пала- 
тализации на динамику формант последующего гласного [3]. 
В слове «съел» твердость согласного подчеркнута тем, что после 
согласного [с] как бы внедряется дополнительный сегмент четко 
выраженного палатального звука [й] и только после этого реали- 
зуется последующий гласный [э] с его начальной левой палатали- 
зацией. В обоих словах на участке гласного [э] видно дальнейшее 
понижение частоты второй форманты, устремляющейся к частот- 
ному локусу последующего гласного [л]. 

В нижнем ряду рис. 4.2.13 приведены спектрограммы слов 
«ус» и «ось», наглядно иллюстрирующие эффект смягчения соглас- 
ного [с’], занимающего конечную позицию в слове, в его спект- 
рально-временной динамике. 
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4.3. РАЗНООБРАЗИЕ РЕАЛИЗАЦИЙ ГЛАСНЫХ 
В УДАРНЫХ И БЕЗУДАРНЫХ СЛОГАХ 


Гласные в словах могут находиться под ударением, а могут 
занимать предударное или заударное положение. Отчетливость 
звуковой реализации гласного весьма существенно зависит от его 
положения относительно ударного слога. 

В ударном слоге акустический паспорт гласного, динамика 
становления и изменения во времени его формантной картины 
выражены лучше всего по двум основным причинам. Во-первых, 
ударный гласный в большинстве случаев длиннее, чем гласные 
в безударных позициях, а это дает необходимое время для прояв- 
ления его акустико-фонетических свойств. Во-вторых, на ударном 
гласном в значительной мере концентрируется артикуляционное 
усилие, которое тесно коррелирует с увеличением акустической 
интенсивности на интервале ударного гласного. 

Гласные в безударных позициях разделяются на предударные 
и заударные. Первый предударный гласный, непосредственно пред- 
шествующий ударному слогу, отличается, как правило, наиболь- 
шей после ударного гласного четкостью своего выражения. Он 
несомненно короче, чем гласный в ударной позиции, однако на 
отрезке его реализации преимущественно сконцентрирована до- 
вольно большая звуковая энергия, что способствует выявлению 
на спектрограмме его признаков, хотя последние и укорочены 
во времени своего проявления. 

Другая позиция, в которой безударные гласные достаточно 
хорошо сохраняют свои спектрально-временные свойства, следуя 
общей фонетической тенденции,— это заударные гласные в ко- 
нечной позиции в слове. Однако общая интенсивность речевого 
сигнала к концу слова падает, и на динамических спектрограммах 
порой можно не увидеть спектрально-временных деталей конеч- 
ного заударного гласного. 

На рис. 4.3.1 в верхнем ряду приведены спектрограммы слов 
«дорога» и «ворбны». Сравнивая ударные и безударные гласные 
в этих словах, можно убедиться в разной отчетливости проявления 
их отличительных признаков на спектрограммах. 

Важным фонологическим правилом русского литературного 
произношения является исключение из употребления гласного [0] 
в безударных позициях, в которых он произносится как соответ- 
ствующая реализация фонемы а. В среднем ряду рис. 4.3.1 при- 
водятся слектрограммы слов «собака» и «начало». Здесь, как 
и на спектрограммах слов «вороны» и «дорога», отчетливо можно 
наблюдать осуществление этого правила, если проанализировать 
частотные характеристики гласных, сравнивая их. | 

Как правило, заударный гласный, находящийся в неконечной 
позиции в слове, редуцирован, т. е. выражен менее отчетливо чем 
в конце слова. Однако в ряде случаев его характеристики вполне 
хорошо выражены на динамической спектрограмме, что видно из 
примеров слов «котенок» и «гусенок» в нижнем ряду (рис. 4.3.1). 
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Рис. 4.3.1. Слева направо: динамические спектрограммы слов [дарОга], 

варОны] — верхний ряд;  [сабАка], [начАла] — средний; |[кат'Онак], 

гус'Онакј— нижний, в которых сопоставляются гласные в ударных и без- 
ударных позициях. 


р = 


В принципе чем дальше расположен гласный от места ударе- 
ния в слове, тем меньше у него шансов быть хорошо выраженным 
на динамической спектрограмме. В непервых предударных и неко- 
нечных заударных слогах проявляются явления редукции глас- 
ных, а в слитной речи, в которой доминирует логическое ударение, 
относящееся к целой синтагме, и уменьшены акустические акцен- 
ты на местах ударений в отдельных словах, спектральный облик 
безударных гласных зачастую сильно размазывается и стираются 
его отличительные ключи. При этом возрастает вариабельность 
реализаций безударных гласных, что показано на серии динами- 
ческих спектрограмм слов на рис. 4.3.2. В одних случаях, как 
в слове «курица», формантная картина всех гласных выражена 
вполне отчетливо, в других, как в слове «ландыши», звуковая 
энергия в конце слова оказывается недостаточной, чтобы отразить 
на электрочувствительной бумаге сонографа след второй форман- 
ты конечного гласного. В слове «телефон» наблюдается редукция 
стационарных участков безударных гласных, особенно в началь- 
ной позиции. К тому же они претерпевают слева и справа пала- 
тальные коартикуляционные влияния граничащих с ними мягких 
согласных, а это приводит к полной и-образности формантных 
характеристик этих коротких звуков. 

В реальной речи разнообразие в отчетливости произношения 
безударных гласных очень велико. Об этом свидетельствуют ди- 
намические спектрограммы слов «дёвочка», «фигура» и «хороша», 
в которых ударение находится в разных слогах и на разных глас- 
ных, что видно на спектрограммах, приведенных в среднем и ниж- 
нем рядах рис. 4.3.2. 

Завершая рассмотрение примеров реализации ударных и без- 
ударных гласных в словах, мы хотим обобщить механизмы, при 
помощи которых осуществляется их фонетическое противопостав- 
ление. 

С одной стороны, ослабление выраженности признаков без- 
ударных гласных является следствием уменьшения их интен- 
сивности в этих позициях. Другой, более существенный механизм 
редукции, удаленных от места ударения гласных,—это сокраще- 
ние их длительности, вследствие чего динамика развертывания 
их формантной картины в большей или в меньшей мере смазы- 
вается, особенно в срединной части, а это не позволяет гласному 
звуку в безударных позициях достичь тех номинальных формант- 
ных локусов, которые он стремится занять, согласно задаваемой 
артикуляционной программе. Если бы гласному было предостав- 
лено достаточное время для реализации этой внутренней артику- 
ляционной программы, то характеристики формантной картины 
заняли бы свои надлежащие частотные места. Но дефицит време- 
ни произношения вносит коррективы справа и слева, не оставляя 
места для проявления стационарного участка, а порой и наслаи- 
вая взаимные влияния друг на друга. Особенно это касается ва- 
риантов произношения гласных и их реализаций, подвергающих- 
ся правой или левой палатализации, мощность которой превосхо- 
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Рис. 4.3.2. Слева направо: динамические спектрограммы слов [кУрљцај, 
{лАндышы] — верхний ряд; [тТьл’ифОн], [д’Эвъчка] — средиий;  [ф’игУра], 
[хърашА] — нижний, в которых демонстрируется вариабельность реализаций 

безудариых гласных по длительности и иитенсивиости. 


106 


дит коартикуляционное влияние остальных коартикуляционных 
жестов *. 

Восстановление фонемного значения гласного в редуциро- 
ванных безударных позициях связано не только с мобилизацией 
тонкостей слуховой рецепции, но и с вовлечением в процесс их 
восприятия высших психологических механизмов, таких как пред- 
сказание и воображение, помогающих восстановить структуру 
гласного не из сигнала, а из памяти. Мы столкнемся с обсужде- 
нием этой проблемы при анализе динамических спектрограмм 
слитной речи. 


4.4. СЛОВА С СОЧЕТАНИЯМИ ДВУХ И БОЛЕЕ СОГЛАСНЫХ 


Сочетания гласных в словах являются широко распространен- 
ной нормой русской речи. Их количество и разнообразие чрезвы- 
чайно большое и привести все примеры невозможно. Часть соче- 
таний согласных произносится близко к требованиям правописа- 
ния, с учетом специфики орфографического выражения мягкости. 
Иногда в сочетаниях согласных происходят явления их ассими- 
ляции по отдельным признакам. В фонетической транскрипции для 
таких случаев широко применяются соответствующие транскрип- 
ционные символы. В целом же, говоря о проблеме орфографиче- 
ского написания и акустического выражения согласных в словах, 
необходимо непременно помнить, что, отнюдь не в меньшей мере 
чем для гласных, произношение согласных звуков часто не сов- 
падает с их буквенным написанием, отличаясь разнообразием аку- 
стических реализаций соответствующих фонем в реальных контек- 
стах. Следует учитывать, что буквенное обозначение звукового 
состава слов сложилось в результате взаимодействия ряда прин- 
ципов, таких как морфологический, фонетический, исторический, 
дифференцирующий и др. Игнорирование любого из них может 
привести к повреждению или перестройке современной стройной 
системы правил, устанавливающих взаимоотношения между фоне- 
тикой и орфографией, между произношением и написанием слов 
[17]. 

На рис. 4.4.1 приведены спектрограммы слов, где встречаются 
двойные сочетания согласных, первым из которых выступает глу- 
хой согласный. Это слова «лапка» [пк], «ветка» [тк] (верхний 
ряд). В них отчетливо проявляются признаки глухих взрывных 
согласных, в том числе растянутый аффрикатизованный взрыв 
согласного [к]. Очень хорошо заметны отличительные ключи со- 
гласных в словах «кофта» [фт] и «мышка» [шк] в среднем ряду 


* Редуцированные гласные, удалеиные от места ударения в слове более 
чем на одии слог (а в заударных слогах — даже в первой. заударной позиции, 
если только она не является конечной), принято в фонетической литературе 
обозначать символами [ъ] (после твердых согласиых) и [5] (после мягких со- 
гласных), подчеркивая тем самым иеоформлеииость частотно-времеиных харак- 
теристик безударных гласных в этих артикуляциоиных условиях [17]. 
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Рис. 4.4.1. Слева направо: динамические спектрограммы слов [лАпкај, 

[в'Этка] — верхний ряд; [кОфта|] [мЫшка] — средний; [кОс'т”и], [бАбъчка] — 

нижний, в которых имеет место сочетание двух согласных с глухим со- 
гласным ңа первом месте. 
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рисунка. В нижнем ряду обращает на себя внимание наличие 
аффрикатизации мягкого [т] в слове «кости» [с’т’], а также реа- 
лизация сочетания согласных [чк] в слове «бабочка». Во всех 
случаях здесь реализуется как фаза смычки, так и фаза аффри- 
катизованного взрыва, но последняя лучше выражена у мягкого 
аффриката [4]. 

Сочетания двух согласных, первым из которых выступает 
звонкий согласный или сонант, приводятся на рис. 4.4.2. Это спек- 
трограммы слов «набла» [бл], «елки» [лк'] в верхнем ряду рисун- 
ка, «дымно» [мн], «форма» [рм] в среднем ряду и «можно» [жн], 
«негде» [гд’] в нижнем ряду рисунка. Последние два слова произ- 
несены другим диктором (Н. 3.) — мужчиной, обладающим мело- 
дическим певческим тембром голоса. Появление хорошо выра- 
женных формант более высоких порядков в гласных свидетель- 
ствует о спектральной насыщенности тембра голоса диктора, 
о хорошо «поставленном» голосе, и их учет имеет большое значе- 
ние в задачах объективной идентификации голоса. Тем не менее 
фонетическое значение высоких формант гласных значительно 
уступает по своей информативности первым двум формантам 
гласных. На динамику и частотную локализацию этих двух фор- 
мант мы обращаем основное внимание. 

Дополнительные примеры слов, в которых встречаются сочета- 
ния двух согласных подряд, можно найти на динамических спек- 
трограммах слов «майка» (рис. 4.2.1), «галка» (рис. 4.2.2.), «лу- 
жайка», «соловьи», «кошка», «угольки», «лампа» (рис. 4.2.5), 
«стой» (рис. 4.2.6), «фонтан», «фабрика» (рис. 4.2.8), «шесть» 
(рис. 4.2.11), «съел» (рис. 4.2.13), «ландыши», «девочка» (рис. 
4.3.2), а также в иллюстративном материале спектрограмм сле- 
дующей главы. 

В словах могут встречаться сочетания трех согласных подряд. 
Примеры таких слов приводятся в верхнем ряду рис. 4.4.3, где 
изображены динамические спектрограммы слов «ламбда» [мбд] 
и «дубльвэ» [бл’в]. В условиях изолированного произношения 
и соблюдения полного стиля русской литературной речи на спек- 
трограммах можно идентифицировать все фонетически информа- 
тивные ключи, видимые в динамике их спектра. 

В среднем и нижнем ряду рисунка показаны спектрограммы 
слов «Дмитрий» и «электроприбор». В этих словах двойные [дм'], 
|трћ, [пр] и даже тройное [ктр] сочетания согласных встречаются 
по два раза. Такие слова все более приближают нас к спектро- 
граммам естественно произнесенных высказываний. После того 
материала, который читатель усвоил при рассмотрении предшест- 
вующих спектрограмм, у него не должно появиться трудностей 
в идентификации звуков в этих словах. 

В приведенных примерах слов согласные звуки выступали до- 
статочно отчетливо, независимо от места, в котором они реализо- 
вались в слове. Мы видели, что отличительные признаки согласных 
проявляются достаточно хорошо как в случаях, когда они высту- 
пают в сочетании с гласными, так и тогда, когда они сочетаются 
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Рис. 4.4.2. Слева иаправо: динамические спектрограммы слов [нАбла], 

[иОлк'и] — верхний ряд; [дЫмна], [фОрма] — средний, [мОжна], [н’Эгд’и] — 

нижний, в которых встречаются сочетания двух согласных, первым из кото- 
рых выступает звонкий согласный или сонант. 
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Рис. 4.4.3. Слева направо: 
динамические спектрограммы 
слов [л’Амбда|), [дубл’вЭ]— 
верхний ряд; [дм'Итр'ин|— 
средний, [эл'эктръпр’ибОр |— 
нижний, в каждом из которых 
дважды выступают двойные 
или тройные сочетания со- 
гласных. 
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с другими согласными, причем представителями разных фонети- 
ческих групп. Не следует, однако, думать, что отличительные 
признаки источника, места и способа образования сохраняются 
всегда в произношении согласных в естественной, слитной речи. 
Сохранность отличительных ключей согласных имеет место при 
соблюдении полного стиля произнощения. Но в случае отхода от 
него отдельные из них начинают смазываться или полностью те- 
ряются. 

Существует, однако, ряд важных фонетических правил, соглас- 
но которым происходит видоизменение признаков звуков речи при 
их реализация в характерных звукосочетаниях. К ним принадле- 
жат в первую очередь так называемые ассимиляции согласных 
по определенным признакам. Они отчетливо проявляются при пол- 
ном стиле произношения в изолированных словах. 


4.5. АССИМИЛЯЦИЯ СОГЛАСНЫХ В СЛОВАХ 
ПО ОТДЕЛЬНЫМ ПРИЗНАКАМ 


Наибольшее значение имеют такие взаимные влияния соглас- 
ных, в результате которых у них теряется один фонетический 
признак, например, твердость или звонкость. Потеря определен- 
ного фонетического признака приводит к тому, что звук приобре- 
тает свойство, противоположное потерянному. Так, потеря звон- 
кости является одновременно приобретением глухости, и, наобо- 
рот, потеря глухости означает приобретение звонкости; потеря 
мягкости означает приобретение твердости, а потеря твердости — 
приобретение мягкости. Акустические кореляты теряемых и приоб- 
ретаемых фонетических свойств хорошо прослеживаются на дина- 
мических спектрограммах, предоставляя исследователю экспери- 
ментальные доказательства существенности тех или иных фонети- 
ческих правил. Наиболее значимыми в речи, поскольку они весьма 
часто встречаются, являются ассимиляции по признаку глухости— 
звонкости согласных, а также ассимиляции по признаку твердос- 
ти— мягкости. 

Ассимиляция согласных по признаку глухости—звонкости про- 
является в виде феномена оглушения звонких согласных перед 
глухими и озвончения глухих согласных перед звонкими. Оглуше- 
ние звонких согласных перед глухими реализуется как потеря 
признака фонации и проявляется на спектрограмме в виде потери 
полосы основного тона в звонком согласном, если за ним следует 
глухой согласный. 

На рис. 4.5.1 приведены слова, в которых имеет место эффект 
оглушения звонких согласных перед глухими. Это слова «всех» 
[фс], «фуражка» [шк], «ёршик» [рш] и «горка» [рк]. Эффект 
потери звонкости звонкими согласными характерно выступает так- 
же в конце слова: если слово заканчивается на звонкий согласный 
по правилам орфографического написания, то в фонетической реа- 
лизации такой согласный теряет признак звонкости, он оглуша- 
ется. Примеры оглушения звонких согласных в конечной позиции 
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Рис. 4.5.1. Слева направо: динамические спектрограммы слов [фс’Эх|, 
[фурАшка] — верхний ряд; [#Оршък], [гОркај — нижний, в которых имеет 
место оглушение звонкнх согласных перед глухими в середине слова. 


приводятся на рис. 4.5.2, где изображены спектрограммы слова 
«вниз», «этаж», «Яков», «Федор», «шар» и «шаг». Следует обра- 
тить внимание, что оглушению в конце слова не подлежат сонор- 
ные лм, н, л, а также й, которые в литературной русской речи во- 
обще не оглушаются. Примерами этого правила могут служить 
спектреграммы слов «сам», «конь», «Михаил», «Николай», приве- 
денные на рис. 4.5.3. 

Чем в большей степени полный стиль приближается к естест- 
венному произношению, тем чаще происходят случаи потери зву- 
ками отдельных фонетических признаков, особенно в безударных 
слогах. Потеря звонкости может иметь разную ступень выражен- 
ности. Особенно часто встречается градуальная потеря звонкости 
в звонком согласном [3|, причем она может иметь место в разных 
позициях в слове. На рис. 4.5.4 приведены динамические спектро- 
граммы слов «ваза», «розы» (верхний ряд), «роза», «коза» (ниж- 
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Рис. 4.5.2. Слева направо: динамические спектрограммы слов [вн'Ис], [этАш]— 
верхний ряд; [#Акъфі, [Ф'Одър| — средний; [шАрь [шАк}— нижний, в кото- 
рых выступает эффект оглушения звонких согласных в конце слова. 
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Рис. 4.5.3. Слева направо: динамические спектрограммы слов [сАм], (кОн') — 
верхний ряд; [мљхаИлј, [н’ькалАй] — нижний, в которых выступают в ко- 
нечной позиции согласные м, н’, л, й, не подлежащие оглушению. 


ний ряд), в которых в разной степени проявляется эффект оглу- 
шения согласного [3] как в безударном, так и в ударном слоге. 

В ряде случаев оглушение звонких согласных может происхо- 
дить под влиянием не только последующих, но и предыдущих 
глухих согласных, как это видно на спектрограмме слова «твер- 
дый» [тф] (рис. 4.5.5). Обратите внимание, что в этом слове оглу- 
шению подвергается только согласный [в’], реализуемый как [ф]], 
в то время как оглушение не касается последующего согласно- 
го [И]. 

Оглушение звонких согласных можно наблюдать в более слож- 
ных комплексах согласных, в которых доминируют глухие элемен- 
ты. Так. в слове «вещественный», приведенном на том же рисунке, 
выступает сочетание трех согласных [ств’], последний из которых 
теряет признак звонкости. В слове «собственный» (рис. 4.5.5 ниж- 
ний ряд) имеет место двойная ассимиляция по признаку глухости: 
сочетание согласных [бств'] реализуется как звукосочетание [пстф']. 
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Рис. 4.5.4. Слева направо: динамические спектрограммы слов [вАза], [рОзыј— 
верхний рад; [рОза], [казА] — нижний, в которых показательна градуальность 
потери признака звонкости согласным з в слове. 


Во всех трех приведенных примерах обращает на себя внимание 
укорочение щелевого [ф’] в комплексе [тф’], однако в безударных 
слогах оно выражено значительно отчетливее, сливаясь в нераз- 
делимую звуковую реализацию этих двух согласных. Мы хотим 
также обратить внимание читателя на факт удлинения интервала 
времени, на протяжении которого реализуется двойной согласный 
[н] в словах «вещественный» и «собственный», о чем более подроб- 
но будет сказано в следующем разделе этой главы. 

Подобные взаимопревращения признаков глухости и звонкости 
могут быть выраженными в большей или меньшей степени, не 
являясь при этом отступлением от литературной нормы русского 
произношения, что указывает на вариативность звуковых реали- 
заций согласных в естественной речи. 

Последним на рис. 4.5.5 приведено слово «мягкий», в котором 
реализуется еще более сложное, комплексное преобразование 
признаков, состоящее не только в оглушении признака звонкости, 


116 





а ва в те 


Рис. 4.5.5. Слева направо: динамические спектрограммы слов [тф’Ордый|, 

[в’иш’Эстф’ьный]} — верхний ряд; [сОпстф'иный], [м’Ах’к’ий|— нижний, в ко- 

торых выступают преобразования согласных типа ассимиляции по признаку 
глухости, имеющие разную сложность. 


но и в одновременной замене признака взрывного согласного на 
щелевой. Это преобразование сочетания согласных [г’к’] в звуко- 
сочетание [х’к’] на динамической спектрограмме слова «мягкий» 
проявляется в реализации лишенного признака основной частоты 
щелевого согласного [х] с его смещающейся вверх полосой шума; 
вслед за ней наступает глухая смычка и аффрикатизованный 
взрыв, локализованный в частотной области, характерной для 
мягкого [к']. 

Ассимиляция согласных по типу их озвончения встречается, 
например, в таких словах, как «пятьдесят» и «шестьдесят». В сло- 
ве «пятьдесят» в сочетании согласных [т’д’] озвончению подлежит 
глухая смычка [т’, вследствие чего весь комплекс реализуется 
как звонкий согласный [д’]. В слове «шестьдесят» происходит 60- 
лее сложное преобразование, поскольку озвончению подлежат два 
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Рис. 4.5.6. Слева направо: динамические спектрограммы слов [тьд’исАт], 


[шъз'д’ис’Ат], произнесенных дикторами М. Д. (верхний ряд), Ю.С. (сред- 
ний), Г.Р. (нижний). 
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первых глухих согласных в комплексе [с’т’д’], вследствие чего он 
реализуется как звукосочетание [3’д']. 

Динамические спектрограммы слов «пятьдесят» и «шестьдесят» 
приводятся на рис. 4.5.6. 

Ассимиляция по признаку мягкости осуществляется в русской 
литературной речи согласно следующему фонетическому правилу 
[17]. Если после твердого согласного в слове следует мягкий со- 
гласный, принадлежащий к одной и той же группе по месту своего 
образования, то тогда предшествующий согласный смягчается. 
В верхнем ряду на рис. 4.5.7 приведена динамическая спектро- 
грамма слова «после», которая иллюстрирует правило смягчения 
предшествующего твердого согласного [с] перед последующим 
мягким [л’], которые принадлежат к одной и той же группе перед- 
неязычных согласных. По восходящему ходу второй форманты 
на протяжении реализации согласного [с] видно, что он посте- 
пенно подвергается палатализующему влиянию последующего мяг- 
кого [л'] и завершает динамику развития как мягкий звук [с?]. 
Когда же в паре двух согласных, из которых первый является 
твердым, а второй — мягким, оба они принадлежат к разным груп- 
пам по месту своего образования, то ассимиляции признака мяг- 
кости не происходит, и твердый согласный такой пары реализуется 
твердо, сопротивляясь смягчению. 

На примере слова «туфли» (тот же рисунок) видно, как по- 
давляется палатализация в начале согласного [ф] губным жестом, 
так что только в конце звука [ф] проявляется тенденция к смаг- 
чению, которая полностью реализуется в последующем мягком 
согласном переднеязычной группы [л’]. В нижнем ряду рис. 4.5.7 
приводится спектрограмма слова «галки», в котором согласные 
[л] и [к] тоже принадлежат к разным группам по месту образо- 
вания. Хорошо видно, что вторая форманта звука [л] стремится 
к нормальному «твердому» локусу, палатализация же совершается 
полностью на интервале звука [к’] и хотя ее формантная дина- 
мика скрыта во время акустической паузы в период глухой смыч- 
ки, спектральная локализация аффрикатизованного взрыва пол- 
ностью разоблачает мягкость этого согласного. 

Дополнительным примером смягчения твердого согласного, 
предшествующего мягкому согласному той же группы, может слу- 
жить слово «кости», спектрограмма которого приведена на рис. 
4.4.1, а также обсуждавшееся ранее преобразование [г’к’] — [х к] 
на примере слова «мягкий» (рис. 4.5.5). 

Что касается обратного влияния — потери признака мягкости 
перед твердым согласным, то это фонетическое явление встречается 
в русской речи значительно реже. Существует несколько типичных 
его реализаций, одна из которых состоит в преобразовании соче- 
тания согласных [н'"ш] в звукосочетании [нш] как в слове «мень- 
ше». Динамическая спектрограмма этого слова приведена в ниж- 
нем ряду (рис. 4.5.7). В согласном [н] трудно заметить частотное 
положение второй форманты, по которому можно было бы судить 
о наличии или отсутствии его палатализации, однако на стыке 
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Рис. 4.5.7. Слева направо: динамические спектрограмм слов [пОс'лиј 

[ТУфл’и| — верхний ряд; [гАлк’и}, [м’Эншы] — нижний, в которых выступает 

эффект фонетической ассимиляции по признаку мягкости — твердости со- 
гласных. 


с последующим [ш] хорошо видно, что согласные [н] и [ш] взаимо- 
действуют по типу совместной переднеязычной, а не палатальной 
артикуляции, вследствие чего звук [н] в этом слове реализуется 
в твердом варианте произношения. 


4.6. РЕДУКЦИЯ ФОНЕМ В ЗВУКОСОЧЕТАНИЯХ 
И ОРФОГРАФИЧЕСКИЕ ФИКЦИИ 


Чем подробнее мы знакомимся с динамическими спектрограм- 
мами слов, тем чаще встречаются нам несоответствия и противо- 
речия между орфографическим написанием слов и их звуковой 
реализацией. Гласные и согласные, орфографически обозначаемые 
тем или иным буквенным символом, подвергаются в звуковой речи 
коартикуляции, ассимиляции, редукции, теряя при этом одни при- 
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знаки и приобретая другие, а порой и вовсе не реализуются на оси 
времени произносимого слова. Последние явления можно наблю- 
дать в тех случаях, когда один и тот же согласный в буквенной 
записи слова удваивается. Акустически удвоение согласного в ор- 
фографической записи слов сводится не к двойной артикуляции, 
а к удлинению времени реализации его характерных признаков. 
Примеры сказанному дают динамические спектрограммы слов 
«каппа», в котором двойное [п] представлено удлиненной паузой 
глухой смычки, и «гамма», в котором двойное [м] выражено сплош- 
ной полосой основного тона и носовых формант. Эти слова пред- 
ставлены в верхнем ряду на рис. 4.6.1. Мы уже встречались с удво- 
ением согласных в словах «Геннадий» (рис. 4.2.2), «собственный», 
«вещественный» (рис. 4.5.5). 

Проблема правильной фонемной интерпретации орфографиче- 
ских текстов актуальна в плане «чтения» (индивидуального или 
автоматического) спектрограмм слов, взятых из русского словаря, 
значительно превышающего по объему запас слов детской «Азбу- 
ки». Дело в том, что в процессе «чтения» динамических спектро- 
грамм в них следует искать те акустические явления, которые 
соответствуют их произношению, а не их буквенному написанию. 
Следовательно, надо научиться представлять себе цену тех или 
иных признаков, часть из которых является необходимыми эле- 
ментами звукового облика слова, тогда как другая часть призна- 
ков может претерпевать различные изменения, вплоть до полного 
исчезновения. 

В фонетике отмечается ряд преобразований разной глубины, 
при которых реализации фонем испытывают на себе влияние со- 
седних звуков и попадают в разряд слабых позиций. В наиболее 
радикальных случаях встречаются так называемые «орфографи- 
ческие фикции». Это удачное выражение употребляется в фоне- 
тической литературе для обозначения таких букв, фонетическая 
реализация которых никогда не имеет места в практике литера- 
турной нормы произношения, но тем не менее их написание по 
традиции сохранилось в орфографии [17]. 

Мы встречались с орфографическими фикциями при написании 
гласных на примерах написания буквы «о» в безударных пози- 
циях, поскольку фонема о здесь в литературной русской речи не 
реализуется вообще, а вместо нее закономерно произносится глас- 
ный [а] (см. примеры динамических спектрограмм на рис. 4.3.1). 
К таким же явлениям относится написание буквы «и» после твер- 
дого согласного, в то время как в этой позиции гласная и не реа- 
лизуется вообще, а его произношение закономерно осуществляется 
в виде реализации звука [ы]. Примеры этому вы видели на дина- 
мических спектрограммах слов «ежик» (рис. 4.2.3) и «ершик» 
(рис. 4.5.1). 

Орфографические фикции распространены также в написании 
ряда согласных в словах. К ним можно отнести, например, напи- 
сание буквы «г» вместо произносимого звука [в] в сочетаниях 
«бго». На динамической спектрограмме, приведенной в среднем 
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Рис. 4.6.1. Слева направо: 
динамические спектрограм- 
мы слов [кАпа] [гАма] — 
верхний ряд; |сидјмОва) — 
средний; [штО] — нижний, в 
которых представлены раз- 
ные формы несоответствия 
между орфографическим на- 
писанием слов и их звуко- 
вой реализацией. 





ЛОО ЈА орва ОИС 


Рис. 4.6.2. Сверху вниз: 
динамические спектрограм- 
мы слова [двАцът’], произ- 
несенного дикторами Г.Р. 
(верхний), Ю.С. (средний) 
и М.Д. (нижний). Конеч- 
ный взрывной т’ в слове 
«двадцать» третьего дикто- 
ра находится за пределами 
спектрограммы. 
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Рис. 4.6.3. Сверху вниз: 
динамические спектрограм- 
мы слова [тр’Ицът'], про- 
изнесенного дикторами Г.Р. 
(верхний), Ю.С. (средний) 
и МД. (нижний). Конеч- 
иый взрывной т’ в слове 
«тридцать» второго дикто- 
ра находится за пределами 
спектрограммы. 


ряду (рис. 4.6.1), мы видим акустическую характеристику произ- 
ношения слова «седьмого». В его конце видны характерные при- 
знаки губного звонкого щелевого согласного [в] (отчетливый след 
второй форманты, указывающий на губной тип артикуляции с ок- 
ружающими гласными), а отнюдь не звонкого взрывного велярной 
группы [г], в котором на интервале звонкой смычки вторая фор- 
манта принципиально не может проявиться. 

На том же рисунке показана спектрограмма слова «что», в ко- 
тором произносится не буквенно обозначенный аффрикат «ч», а 
щелевой согласный [ш]. Это легко заметить по нижней границе 
спектра шума, определяющей твердость произношения [ш] в про- 
тивовес требованию мягкости при реализации согласного [ч]. 

Орфографической фикцией является написание буквы «в» в 
слове «чувство», в котором согласный [в] не просто оглушается, 
но вовсе не реализуется в русском литературном произношении. 
В таких словах как «двадцать» и «тридцать» (рис. 4.6.2 и 4.6.3 
соответственно) элемент [д] в середине слова не только оглушает- 
ся, но полностью редуцируется до удлиненной паузы перед шумовой 
частью аффриката [ц], реализуя преобразование «дц»—[ц]. Ранее 
мы отмечали также преобразование типа «стьд»- [з'д'], выступаю- 
щее в слове «шестьдесят» (его спектрограмма приведена на рис. 
4.5.6). 

Список подобных явлений можно продолжить. Существует пе- 
речень сочетаний двух и трех букв внутри слов, в которых один 
согласный полностью выпадает в произношении, следуя таким 
преобразованиям: 

«стн» — [сн], как в слове «честный», 

«здн» — [зн], как в слове «поздно», 

«стл» — [сл], как в слове «счастливый», 

«рдц» — [рц], как в слове «сердце», 

«лиц» — [нц], как в слове «солнце», а также некоторые другие. 

Следует иметь в виду, что звуковая реализация этих и ряда 
других буквенных сочетаний в орфографической записи текста 
зависит от грамматического класса слова и поэтому в случае 
непрерывной речи требует морфологического анализа текста, пред- 
шествующего процессу идентификации фонем. 


ГЛАВА У 


ДИНАМИЧЕСКИЕ СПЕКТРОГРАММЫ 
СЛИТНЫХ ФРАЗ 


Фраза, или предложение — это сочетание слов, выражающее 
законченную мысль [27]. Примеры предложений, динамические 
спектрограммы которых приведены в настоящей главе, взяты из 
уже упоминавшейся «Азбуки» [6]. Диктор (М.Д.) произносил эти 
предложения полным стилем, четко выговаривая произносимые 
фразы. Одновременно с этим слова не отделялись друг от друга, 
а чтение предложений было слитным. 


51. АКУСТИЧЕСКИЕ ЯВЛЕНИЯ НА СТЫКАХ СЛОВ 


На рис. 5.1.1 приведены динамические спектрограммы трех 
предложений. Первое из них — «Вова пас корову». Рассматривая 
локализацию и свойства звуков речи в этой фразе, можно пред- 
положить, что слова отделены друг от друга паузами. На самом 
деле это не так. Паузы, проявляющиеся на спектрограммах, яв- 
ляются следствием глухих смычек глухих взрывных согласных, 
с которых начинаются произнесенные слова «пас» и «корову». 

Анализ дальнейших спектрограмм убеждает нас в правильнос- 
ти нашего вывода. Так, в предложении «На суку был жук» аку- 
стическая пауза выступает только в начальной фазе глухого 
взрывного согласного [к]. А фраза «Наши гуси на лугу» произне- 
сена без единой паузы. Слитность произношения слов и отсутствие 
каких-либо акустических маркеров начала и конца отдельных 
слов в произнесенном предложении выступает в приведенных 
динамических спектрограммах весьма отчетливо. Тем не менее 
полный стиль произношения позволяет без труда найти отдельные 
звуки, из которых состоят эти фразы, учитывая знакомые уже 
нам коартикуляционные явления. 

В примерах, приведенных на рис. 5.1.2, читатель, прослеживая 
выраженность отдельных звуков в слитно произнесенных фразах, 
очевидно, обнаружит, что отчетливость разных акустико-фонети- 
ческих признаков на динамических спектрограммах неодинакова. 
Хорошо идентифицируются глухие взрывные согласные по их 
акустическим паузам, а также глухие щелевые согласные по спек- 
тральным характеристикам их фрикативного шума. На спектро- 
грамме предложения «Наш Пушок шалун» четко выделены глухие 
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Рис. 5.1.1. Дннамические спектрограммы слитно 

пронзнесенных фраз [вОвапАскарОву], [нъсу- 

кУбЫлжУк] — верхний ряд; [нНАшыгУс’ьнълугУ] — 

нижний, демонстрирующие наличие пауз в фазе 

смычки глухнх взрывных согласных и отсутствие 

пауз между отдельными словами. Ударение отме- 
чено большой буквой. 
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смычки [п] и [к} и характерный шум щелевого [ш], трижды прояв- 
ляющийся в данной фразе. В предложении «Лева бросаёт палку» 
следует обратить внимание на характеристики взрывных соглас- 
ных [тј [п], [К] и щелевого [с]. В довольно длинной фразе «Де- 
вочка ловила сачком бабочку», произнесенной как одна недели- 
мая синтагма, слитность нарушается только в местах произнесения 
аффриката [ч] и взрывного [к], причем это повторяется во фразе 
трижды. 


5.2. РОЛЬ НАДЕЖНО ИДЕНТИФИЦИРУЕМЫХ ПРИЗНАКОВ 
ФОНЕМ ДЛЯ «ЧТЕНИЯ» ДИНАМИЧЕСКИХ 
СПЕКТРОГРАММ СЛИТНОЙ РЕЧИ 


Вопрос о том, можно ли в принципе с помощью зрения осу- 
ществить то, что свойственно делать слуху, имеет серьезное тео- 
ретическое и практическое значение. Если принять, что динами- 
ческая спектрография отражает наиболее существенные явления 
частотного анализа акустического сигнала, которые происходят 
на основной мембране внутреннего уха, то изучение динамических 
спектрограмм слитной речи следует рассматривать как метод 
получения объективной картины слухового процесса, визуализи- 
рованной в доступной для изучения форме. Мы придерживаемся 
именно этой точки зрения. Сказанное не означает, однако, что 
спектральная картина «видимой речи» является полным отобра- 
жением слуховой рецепции речи во всех ее деталях. Слуховой 
анализатор человека является несравненно более чувствительным 
прибором, чем спектральный анализатор аппаратов «видимой 
речи». 

Опыт изучения динамических спектрограмм естественных вы- 
сказываний показывает, что акустические признаки, используемые 
в фонетике для классификации звуков речи, проявляются в рече- 
вом потоке с неодинаковой отчетливостью. Поэтому логично тре- 
бовать, чтобы разным признакам приписывалась разная степень 
доверия при визуальном «чтении» динамических спектрограмм 
речевого высказывания. К числу идентифицирующих признаков, 
имеющих ключевое значение, следует прежде всего отнести ши- 
рокие полосы шума, локализованные в разных областях частот, 
которые регистрируются на динамических спектрограммах при 
реализации твердых глухих щелевых согласных [с], [ш] и мягких 
СТ, [х'], [ф']. Узкая по частоте полоса шума, обладающая доста- 
точной длительностью, является хорошим признаком для иденти- 
фикации глухого щелевого [х]. К надежным идентификаторам 
глухих взрывных согласных относятся паузы, а следующие за 
ними взрывные сегменты в зависимости от их длины и частотной 
локализации позволяют судить о наличии глухих взрывных со- 
гласных или аффрикатов. Наличие полосы основного тона позво- 
ляет принять решение о классе вокализованных звуков, а четко 
выраженная формантная структура сегмента — о его принадлеж- 
ности к классу гласных, а также о вероятном расположении звука 
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в плоскости формантного треугольника. Наконец, полезную ин- 
формацию несет формантная динамика, свидетельствующая 
о коартикуляционных событиях в высказывании. 

Очевидно, что в процессе «чтения» динамических спектрограмм 
желательно опираться именно на эти опорные акустические явле- 
ния, которые хорошо коррелируют с некоторыми звуками речи. 
Такие опорные точки логично искать в ударных слогах, но не 
только в них; их следует искать в любых контрастных звукосоче- 
таниях, в контрастах сонорных и шумных, щелевых и взрывных 
звуков и т.п. В настоящее время уделяется большое внимание 
алгоритмам чтения динамических спектрограмм и способам выяв- 
ления опорных точек для фонемного анализа слов в процедурах 
автоматического распознавания речи [7, 25, 32]. 

В последующих примерах динамических спектрограмм слитно 
произнесенных предложений мы будем комментировать в первую 
очередь те узловые звуки или сегменты, которые помогают по- 
фонемно идентифицировать целые предложения. 

На рис. 5.2.1 первой приведена динамическая спектрограмма 
предложения «Хорошо в лесу летом». Пытаясь найти на спектро- 
грамме слово «хорошо», мы сразу обращаем внимание на щеле- 
вой согласный [ш], обладающий характерным интенсивным шумом 
и находящийся в ударном слоге. После локализации [ш] легко 
найти остальные звуки в слове «хорошо» — безударные а-образные 
гласные, начальный щелевой [х], а также идентифицировать пре- 
рывистость а-образной формантной структуры как проявление дро- 
жащего сонанта [р]. 

Участок фразы «в лесу» легче всего фонемно декодировать, 
установив сначала место локализации щелевого [с]. Последова- 
тельность звуков [вл'и] теперь хорошо заметна: небольшой сегмент 
с ослабленной фонацией после ударного [0] — это [в]; в нем, 
в частности, виден эффект губной коартикуляции по «твердому» 
типу, в силу чего вторая форманта направляется вниз. А на 
участке [л’] она начинает свое движение вверх к палатализованно- 
му и-образному положению, характерному для эффекта мягкости, 
в котором она продолжает находиться и на участке безударного 
и—э-образного гласного. Фонация сопровождает непрерывный ряд 
звуков [улэ], которые легко локализовать на спектрограмме, а за- 
тем и фонемно дешифровать. После глухой смычки, являющейся 
необходимым и надежным идентификатором глухого взрывного 
[т], удается найти сегменты, отвечающие звукам безударного сло- 
га [там], невзирая на редукцию конечного [а] до двух периодов 
основного тона и на совсем не видную на спектрограмме назали- 
зацию согласного [м]. 

Проведем анализ динамической спектрограммы фразы «Слоны 
ели сено», приведенной справа в верхнем ряду рис. 5.2.1. Фраза 
произнесена слитно в том смысле, что акустических пауз в ней 
нет ни между словами, ни между отдельными звуками. Слово 
[сланы] легко идентифицировать по хорошо выраженному глу- 
хому щелевому [с], а также по характерной формантной структуре 
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Рис. 5.2.1. Динамические спектрограммы слитных 
фраз [хърашОвл'исУл'Этьм|, [сланЫйЭл'ис'Эна]— 
верхний ряд; [нАшъс'им'йАбал'шАйа] — нижний. 





назального [н] в ударном слоге с его неподвижными носовыми 
резонансными полосами. Установив место на спектрограмме зву- 
ков [с] и [н|, мы получаем необходимые основания для идентифи- 
кации находящегося между ними сегмента со сложно движущи- 
мися вверх формантами не как одного гласного звука, а как зву- 
косочетания [ла]. Одновременно легко обнаружить место пала- 
тального согласного [И] по шумовой составляющей и высоко- 
частотному положению второй форманты в его начале. Для нас 
становится отчетливее дифтонгоидная формантная структура глас- 
ного [ы], и, кроме этого, удается обнаружить факт назализа- 
ции этого гласного по продолжающейся от согласного [н| носовой 
форманте. 

Звук [с’] занимает центральное положение в анализируемой 
фразе, поэтому нельзя не использовать его для разделения фразы 
на более мелкие слоговые участки. Слева от него располагается 
звукосочетание [Изл'иј, в котором переднеязычный сонант [л’] от- 
мечен незначительными импульсными щелчками языка. Палата- 
лизация в виде и-образного положения второй форманты удержи- 
вается до самого начала последующего ударного гласного [э] 
в слове [с'знај, в котором нетрудно декодировать составляющие 
его звуки. 

На примере предложения «Наша семья большая» (нижний ряд 
рис. 5.2.1) показана роль глухих щелевых согласных как актив- 
ных идентификаторов слов на динамических спектрограммах 
слитной речи. После опознания звука [ш] в слове «наша» легко 
идентифицируются звуки [н], ударное и безударное [а]; после глу- 
хого [с] можно локализовать и распознать звуки [и], [м’], сегмент 
[й] и ударное [а] с характерным и—а-образным движением фор- 
мант. Перед глухим щелевым [ш] без труда можно локализовать 
отдельные звуки звукосочетания [бал’], а после него — звукосо- 
четание [айа] с тенденцией к редукции последнего элемента этого 
трифтонга. 

Очень важно подчеркнуть, что использование спектрально-вре- 
менной информации в процессе «чтения» динамических спектро- 
грамм требует системного, комплексного подхода, который, одна- 
ко, нелегко представить в виде последовательности формально 
осуществляемых операций фонемной дешифровки звуковых эле- 
ментов анализируемой фразы. Одна из основных трудностей ана- 
лиза динамических спектрограмм в режиме их фонемного «чтения» 
состоит в невозможности уверенно сегментировать речь на отдель- 
ные звуки. Последовательности фонем (например, звонких или 
сонорных согласных или их сочетаний с гласными) можно легко 
принять за неделимые звуковые элементы, и тогда возникают 
ошибки сегментации типа пропуска фонем. В других случаях 
небольшая шероховатость в спектре может быть расценена как 
свидетельство отдельного фонетического элемента, уменьшение 
общей интенсивности звука — как свидетельство паузы и т. п., 
а это приводит к ошибкам сегментации типа выявления ложных 
сегментов. 
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Рис. 5.2.2. Динамические спектрограммы 

слитных фраз [унАзбылАгАлкај], [задОмъм- 

растУдубЫ] — верхний ряд; [тУдбЫл'ишА- 

р’ьк’итУз’ьк] — нижний, в которых обра- 

щается внимание на примеры ассимиляции 
признаков согласных. 


Другая сложность при «чтении» динамических спектрограмм 
заключается в трудностях самой фонемной идентификации зву- 
ковых сегментов в условиях неполно или ненадежно выявленных 
признаков. Как правило, задача идентификации решается при 
отсутствии всего комплекса отличительных признаков фонем, 
а следовательно, принятие решения имеет большую или меньшую 
неопределенность. 

Приводимые ниже примеры «чтения» динамических спектро- 
грамм фраз иллюстрируют сложность выявления и интерпретации 
идентифицирующих ключей в ходе их визуального анализа. 

Нахождение надежных спектрально-временных ключевых иден- 
тификаторов может быть затруднено в силу разных сопутствую- 
щих причин. К ним, в первую очередь, следует отнести ряд уже 
известных нам фонетически значимых закономерностей, прису- 
щих литературному стилю произношения. Это явление ассимиля- 
ции признаков согласных, редукции гласных в безударных поло- 
жениях, разной степени коартикуляционных воздействий смежных 
звуков друг на друга и т.п. Примеры этих явлений приведены 
на рис. 5.2.2 в динамических спектрограммах фраз, где обращается 
внимание на факты озвончения глухих согласных на стыках слов 
перед звонкими согласными. 

В верхнем ряду рис. 5.2.2. на динамической спектрограмме 
фразы «У нас была галка» слитное сочетание с и б произнесено 
как звукосочетание [зб]. Вокализацию глухого согласного т и его 
переход в звонкий звук [д] перед последующим звонким соглас- 
ным [6] мы видим в нижнем ряду рисунка на спектрограмме 
фразы «Тут были Шарик и Тузик», начальная часть которой 
реализована звуковой последовательностью [тудбыл’и]. В верхнем 
ряду этого же рисунка мы можем наблюдать пример ассимиляции 
глухого взрывного т следующим за ним звонким согласным [д] 
на стыке слов «растут дубы» во фразе «За домом растут дубы». 
На динамической спектрограмме этой фразы видно, что звуки [1] 
и [д] сливаются в единый сегмент озвученной смычки с последую- 
щим переднеязычным взрывом. 5 

Подобные явления, обусловленные фонетическими правилами, 
можно учесть в алгоритмической интерпретации динамических 
спектрограмм в процессе их «чтения», но тогда шансы на успех 
сохранятся только в случае соблюдения диктором литературного 
стиля произношения. В реальной речи, однако, имеет место высо- 
кая вероятность отхода в тех или иных местах высказывания от 
требований литературного стиля, что отнюдь не мешает коррект- 
ному восприятию таких высказываний, но вносит дополнительные 
трудности в процесс «чтения» спектрограмм. 

На рис. 5.2.3 приведены динамические спектрограммы фраз, 
в отдельных словах которых звонкие щелевые согласные теряют 
признак звонкости, причем не только в фонетически слабых пози- 
циях, где этого можно было бы ожидать, но и в таких фонети- 
чески непредсказуемых местах, как ударные слоги. Естественно, 
это лишает такие важные ключевые звуки как щелевые соглас- 
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Рис. 5.2.3. Динамические спектро- 
граммы слитных фраз [Эт'ив'Эш'и- 
в АжутнафАбрљк'и] — верхний ряд; 
[казАдавАланАмълакО] — нижний, в 
которых обращается внимание на 
потерю отдельными реализациями 
согласных признаков способа обра: 
зования. В нижнем ряду справа — 
динамическая спектрограмма слит- 
ной фразы, которую предлагается 
расшифровать самостоятельно. 
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ные их высокоинформативных признаков и создает трудности 
в интерпретации спектрограмм в целом. В верхнем ряду рисунка 
представлена динамическая спектрограмма фразы «Эти вещи вя- 
жут на фабрике», в которой сегмент звука [ж] явно девокализован. 
Обратите внимание также на редукцию звукосочетания [тна], фо- 
немные характеристики которого можно восстановить на спектро- 
грамме только благодаря априорному знанию контекста, помо- 
гающему локализовать это звукосочетание между глухой смычкой 
[т] и шумом последующего щелевого [$]. Во фразе «Коза давала 
нам молоко», динамическая спектрограмма которой приводится 
в нижнем ряду рисунка слева, проявляется тенденция произно- 
сить звонкие согласные в глухом, как бы шепотном варианте, что 
часто наблюдается в беглой речи с разной степенью выраженнос- 
ти. В данном случае звук [3] произнесен без характерной для 
звонкого согласного вокализации. 

На этом этапе знакомства со спектрограммами слитно произ- 
несенных фраз у нас, естественно, может возникнуть идея такой 
организации процесса «чтения» динамических спектрограмм, в ко- 
тором на каждом элементарном акте фонемного декодирования 
звукового сегмента принимались бы не однозначные фонемные 
решения, а допускались бы некоторые неоднозначности. Попыта- 
емся разобрать принцип работы такого алгоритма чтения динами- 
ческих спектрограмм на примере анализа фразы, приведенной 
справа в нижней части рис. 5.2.3. Чтобы инициировать активный 
самостоятельный анализ этой спектрограммы, мы приведем на- 
звание фразы только после завершения ее дешифровки. 

Мы рекомендуем читателю попрактиковаться в визуальном 
нахождении отдельных звуков речи на динамической спектро- 
грамме анализируемой фразы, руководствуясь знакомыми нам 
спектрально-временными ключами русских фонем. Эти упражне- 
ния желательно делать с карандашом и в случае неопределенности 
в фонемном решении отдельных сегментов выписывать неодно- 
значные решения. Впоследствии попытайтесь установить, что было 
изображено на динамической спектрограмме, вспоминая слова из 
детского букваря, с которыми мы встречались в предшествующих 
разделах. В данном случае фраза очень простая, и вы, несомнен- 
но, достигнете в этом успеха. 

Прежде всего отметим [ш]- или [ф]-образный сегмент и гласный 
[а] с хорошо выраженным стационарным участком в начале фра- 
зы, по-видимому, ударный. Звонкий сегмент перед звуком [а] по- 
хож на согласный [н] или [д]; по коартикуляционному влиянию 
на последующий гласный он, по-видимому, образован по передне- 
язычному, а не губному типу. 

Итак, в начале слова имеет место следующая вероятная после- 
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н 8, 
довательность звуков: а . Следующий сегмент — это, ве- 
д ш 


роятно, непалатализованный безударный гласный, который ·обо- 
значим индифферентным символом [ъ]. За ним следует четкий 
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глухой щелевой согласный [ш], вероятнее всего в ударном слоге, 
так как за ним выступает хорошо выраженный гласный [у] или [0] 
с последующей переднеязычной коартикуляцией. Прерывистый 
спектр обусловлен, по-видимому, дрожащим [р], после чего доста- 
точно надежно выступают компоненты [а], [н] или [м] и снова [а]. 
Конечный гласный — тоже [а]. Он находится под ударением, что 
видно по сопоставлению его длительности с длительностями пре- 
дыдущих сегментов, которые мы идентифицировали как гласные. 
Но нет уверенности, что это конечный звук фразы. И достаточно 
неопределенный сегмент перед этим ударным [а]: он может быть, 
вероятнее всего, звуком [в], [л] или [6]. Итак, запишем нашу 
попытку дешифровать имеющуюся перед нами динамическую 
спектрограмму в виде 


н Ш у м Л 
а ъш ра ава 
д ф о н б 
(подчеркнуты ударные гласные). Размышляя над этой неодно- 
значно расшифрованной фразой, вы, наверное, догадаетесь, что 
здесь была произнесена фраза «Наша Шура мала». 

Указанный метод предварительной сегментации, неоднозначной 
фонемной идентификации сегментов и пробного синтеза всевоз- 
можных слов и предложений из популярного словаря с использо- 
ванием известных правил синтаксиса с успехом был испытан 
в виде программной модели распознавания простых речевых со- 
общений на ЭВМ [8, 9, 22, 37]. В случае, когда в составе слов 
встречаются достаточно контрастные акустические звуки и струк- 
тура фразы достаточно проста, такой алгоритм работает вполне 
эффективно. 


5.3. РОЛЬ АПРИОРНЫХ ЗНАНИЙ, КОНТЕКСТА 
И ЭВРИСТИЧЕСКИХ ПРЕДСКАЗАНИЙ 
В «ЧТЕНИИ» ДИНАМИЧЕСКИХ СПЕКТРОГРАММ РЕЧИ 


Наряду с информацией, содержащейся в самом речевом сигна- 
ле в виде достоверно идентифицируемых участков его фонемного 
скелета, важнейшую роль для осмысленного восприятия динами- 
ческих спектрограмм речевого сообщения имеет учет контексту- 
альной информации. Учет контекста в анализе речевого сигнала 
предполагает использование в процессе восприятия источников 
знаний (сведений и предположений) о структуре словаря опреде- 
ленного языка, о взаимодействиях и взаимосвязях между словами 
данного языка, придающих им соответствующие грамматические 
формы, изменяющие их акустическое звучание. В контекстуальной 
информации в явной или скрытой форме содержится потенциаль» 
ный резерв сведений о языке — законах его лексики, грамматики, 
семантики и прагматики в форме, в которой используются не- 
сравненно более высокие уровни абстракции и символики чем те, 
которые выступают в закономерностях фонетической реализации 
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фонем в звукосочетаниях. Эти закономерности постоянно извле- 
каются из памяти человека, пользующегося данным языком 
в режиме речевого общения, составляя основу его речевого мыш- 
ления и речевой коммуникации. 

Мы не можем отрицать того очевидного факта, с которым 
читатель постоянно сталкивался, анализируя динамические 
спектрограммы слов и фраз, что в речи зачастую нет в наличии 
полного комплекта признаков — акустических коррелятов произ- 
ношения отдельных фонем. Их нет не потому, что они не были 
выявлены сонографом в процессе анализа, а потому, что они 
объективно не были произнесены. После того как мы ознакоми- 
лись на материале динамических спектрограмм с такими фоне- 
тическими явлениями, как коартикуляция звуков речи, их редук- 
ция во времени и в пространстве признаков, ассимиляция 
и извращение отдельных признаков, небрежное выговаривание не- 
которых звуков и т. п., мы не можем не призадуматься над тем, 
почему при столь большой вариабельности в произношении от- 
дельных звуков речевые высказывания в целом устойчивы для 
восприятия и понятны слушателю, владеющему данным языком. 

Совокупность накопленных в настоящее время разносторонних 
знаний о речи как коммуникативном процессе, свойственном ис- 
ключительно человеку, позволяет высказать утверждение, что 
восприятие акустического речевого сообщения в его спектрально- 
временной динамике организовано по типу предсказания (стиму- 
лируемого наличием в сигнале надежно рецептируемых свойств 
отдельных звуков) некоторого конечного количества правдоподоб- 
ных высказываний и их текущей проверки. Вероятнее всего, что 
сам процесс текущего предсказания высказываний формируется 
на словесной основе и что в структуре словесных гипотез исполь- 
зуются свойства слов как фонемных последовательностей, харак- 
теризующихся соответствующей спектрально-временной динамикой 
в пространстве фонетических значимых признаков. Несомненно 
также, что формирование предсказываемых высказываний проис- 
ходит с учетом грамматических и семантических закономерностей 
используемого языка. Предельным упрощением организации 
осмысленного воспрятия акустического речевого сообщения на 
основе анализа его спектрально-временной динамики является 
случай, когда аудитор заранее осведомлен о перечне возможных 
слов или предложений, которые могут быть реализованы в данной 
ситуации. 

Мы попытаемся на отдельных примерах рассмотреть принци- 
пиальную структуру такого анализа динамических спектрограмм, 
который сводится к их осмысленному нелинейному «чтению», ру- 
ководимому эвристическими догадками в условиях априорной 
осведомленности о возможных высказываниях. Такой процесс 
текущего анализа динамических спектрограмм можно организо- 
вать на пофонемной основе. Чтобы убедиться в том, насколько 
помогает в этом анализе факт догадки, ожидаемого предположе- 
ния, текстовой подсказки, рассмотрим динамические спектрограммы 
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фраз, приведенные на рис. 5.3.1. В этих фразах выступают слова, 
в которых, наряду со щелевыми глухими согласными, встречаются 
и звонкие щелевые, тоже обладающие вполне значимыми иденти- 
фикационными ключами. Играют свою роль и другие четко про- 
изнесенные звуки, такие как [н] с его носовыми резонансными 
полосами, стационарные участки гласных и их характерные и- 
образные переходы на стыках с мягкими согласными, глухие 
и звонкие смычки во взрывных согласных и т. п. 

Однако, невзирая на полный стиль произношения этих фраз, 
для многих содержащихся в них звуков остается неразрешенной 
неоднозначность относительно их фонемной принадлежности. 
О многих сегментах трудно с определенностью судить — [в] это 
или [л], [л] или [д], [м] или [н], [р] или [к], [Ц] или [ч] и т.п. 
Часто бывает затруднительно сказать, сколько звуков заключено 
в анализируемом сегменте. Попытайтесь «прочесть» динамические 
спектрограммы любой из приведенных фраз, не прибегая к чтению 
подписи, и вы убедитесь, до чего это трудное и полное неопреде- 
ленности занятие. Достаточно нам, однако, прочесть буквенную 
подпись под анализируемым предложением, как все фонемные 
элементы динамической спектрограммы, в том числе и те, кото- 
рые только что казались нам отсутствующими, или сомнительными, 
станут совершенно очевидными. Идентифицировать звуковые реа- 
лизации фонем на динамической спектрограмме предложения 
после подсказки удается легко и просто. 

В верхнем ряду на рис. 5.3.1 приведена спектрограмма фразы 
«Я рисую домик». Обратите внимание, как помогает в фонемной 
идентификации звуковой структуры фразы щелевой согласный [с] 
и звонкий взрывной [д] с его влилнкем на движение второй фор- 
манты, четко указывающим на переднеязычное происхождение 
взрыва. Но можно ли надежно утверждать о наличии на спектро- 
грамме дрожащего [р], не предполагая заранее, что фраза начи- 
нается со слов «Я рисую»? Или можно было бы, не зная начала 
фразы, идентифицировать гласные [у] в звукосочетании [уйу] по 
ходу постоянно движущейся и недостигающей нужных локусов 
второй форманты? Так ли безоговорочно несомненен по своей 
структуре сегмент конечного [и] в слове «домик»? Нет, все эти 
звуки выражены очень неотчетливо, неопределенно и вовсе не со- 
держат всех необходимых отличительных признаков для их фо- 
немной идентификации. 

В этой неопределенной ситуации выступает важнейшее свойство 
восприятия речи человеком, которое состоит в явном (осознан- 
ном) или скрытом (неосознанном) использовании предварительно 
накопленных знаний, заложенных в его языковой памяти. В слу- 
чае ознакомления с текстовой подписью высказывание становится 
априорно известным с абсолютной уверенностью, так что задача 
«чтения» динамической спектрограммы состоит в ее ретроспек- 
тивной фонемной идентификации. В случае же естественного 
восприятия речи мыслительная деятельность слушателя форми- 
рует в режиме предсказания некоторое множество возможных 
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Рис. 5.3.1. Динамические спектрограммы фраз, 
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текста в «чтении» динамических спектрограмм 
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(правдоподобных) высказываний, которые конкурируют между 
собой и требуют более сложного анализа по типу фонемного раз- 
личения. Но так или иначе мыслительная деятельность человека, 
находящегося в режиме речевой коммуникации (восприятие аку- 
стической речи или чтения динамических спектрограмм) в своей 
сущности направлена на выдвижение текущих гипотетических 
высказываний, руководствуясь при этом знаниями конкретной ком- 
муникационной ситуации, лексики и грамматики данного языка, 
а также сведениями из ранее проанализированного контекста. 
В таком режиме нахождение соответствующих звуков в анализи- 
руемой фразе происходит не только легко, но и вызывает чувство 
удовлетворения, сопровождающее любую завершенность действия 
и достижение цели. 

В верхнем ряду справа на рис. 5.3.1 приведена спектрограмма 
предложения «Малыши играли». Конечно, локализация щелевого 
согласного [ш] со всей очевидностью помогает в фонемном деко- 
дировании слова «малыши». Но еще более важную роль играет 
здесь заведомо известный контекст, ибо без контекстуальной 
«подсказки», что на спектрограмме изображено именно слово «ма- 
лыши», не представляется возможным расчленить начальный звон- 
кий сегмент этой фразы на сочетание четырех звуков |м], [а], 
[л], [ы]. 

В нижнем ряду на рис. 5.3.1 показана динамическая спектро- 
грамма фразы «Зина дала мыло». Она интересна тем, что в ней 
нет глухих щелевых согласных, так что в качестве опорных звуков 
здесь выступают иные четко произнесенные звуки. В частности, 
здесь выделяются элементы носовых [н] и [м], а также щелевого 
[37] и взрывного [д]. Целостное восприятие и окончательная фонем- 
ная идентификация фразы возможны только на фоне предвари- 
тельного знания контекста. 

Роль контекста проявляется также в фонемной расшифровке 
начальной части фразы «За домом растут дубы», которая была 
приведена на рис. 5.2.2. Сегмент [омам] удается уверенно разде- 
лить на содержащиеся в нем четыре звуковых элемента толь- 
ко при условии предварительного знания искомых слов «за 
домом». 

Таким образом, для того чтобы справиться с задачей восприя- 
тия достаточно сложных речевых посылок в режиме «чтения» 
спектрограмм, требуется эффективное использование контекста. 
Для этой цели нужно постоянно и бегло формировать предполо- 
жения и предсказания о том, что могло бы быть произнесено 
в данной ситуации диктором, и проверять свои предложения, 
сверяя их с акустической структурой динамической спектро- 
граммы. 

Попытаемся применить к расшифровке динамических спектро- 
грамм метод текущего выдвижения словесных предположений и их 
проверки. 

Рассмотрим динамические спектрограммы шести фраз, приве- 
денные на рис. 5.3.2, 5.3.3 и 5.3.4. На них изображены динами- 
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ческие спектрограммы следующих фраз: «Федя и Ваня ловили 
рыбу», «Илюшу мама водит в ясли», «У Левы была собака Бо- 
бик», «Летом серый, зимой белый», «По ночам филин ловит мы- 
шей», «Шарик роет мох под елкой». Читателю предоставляется 
возможность, при желании, идентифицировать их самостоятельно. 
В данном случае задача заключается в том, чтобы осуществить 
выбор из шести возможных фраз, анализируя отдельные ключе- 
вые признаки динамических спектрограмм. 

Во фразе «Федя и Ваня ловили рыбу» четко выражен фрика- 
тивный шум мягкого глухого щелевого [ф’], за которым следует 
и—э-образный сегмент с последующей звонкой смычкой [д’]. По- 
видимому, ей соответствует верхняя спектрограмма на рис. 5.3.2. 
Действительно, дальнейшие фонемные события, выступающие на 
этой спектрограмме, хорошо укладываются в структуру фразы 
«Федя и Ваня ловили рыбу». 

С глухого щелевого согласного также начинается нижняя 
спектрограмма рис. 5.3.4, но в ней имеется совсем другая после- 
довательность звуковых явлений. Это, очевидно, фраза «Шарик 
роет мох под елкой». Здесь на своих местах находятся такие 
хорошие идентификаторы, как глухие взрывные [0], [т], [к], видна 
характерная полоса шума глухого [х] и носовые резонансы [м], 
в нужном направлении движутся форманты, маркируя эффекты 
палатализованного произношения. 

На верхней и нижней (рис. 5.3.3) спектрограммах выделяются 
в середине фразы сегменты с-образного шума. Это очевидно фра- 
зы «У Левы была собака Бобик» и «Летом серый, зимой белый». 
Конечно, [с] верхней спектрограммы рисунка 5.3.3 принадлежит 
слову «собака» — там находится и звонкая смычка [6], и глухая 
смычка со взрывом [к]. И также ясно, что [с] нижней спектро- 
граммы на рис. 5.3.3 принадлежит слову «серый» с его характер- 
ным и—8-образнем движением формант, переходящим в дрожа- 
щее переднеязычное [р]. 

Наконец, легко находим фразу «Илошу мама водит в ясли» — 
она изображена на нижней спектрограмме рис. 5.3.2; на ней выде- 
ляются характерные шумы звуков [ш] в слове «Илошу» и [с] 
в слове «ясли». 

Вполне соответствует структуре фразы «По ночам филин ловит 
мышей» последовательность акустико-фонетических событий, изо- 
браженных на верхней спектрограмме рис. 5.3.4. 

Мы надеемся, что приведенный материал динамических 
спектрограмм и принципы их «чтения», изложенные выше, позво- 
лили читателю убедиться в той важной роли, которую играет 
контекст в расшифровке спектрограмм, о роли формирования 
текущих предложений в осуществлении процесса восприятия 
осмысленной речи. В реализации указанных механизмов речевого 
мышления в значительной мере заключается феномен использо- 
вания избыточности речевого сигнала, воспринимаемого слушате- 
лем. Есть основания думать, что принцип выдвижения словесно- 
фонемных гипотез о речевом сигнале и их текущей проверки 
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в пространстве фонетически значимых спектрально-временных при- 
знаков окажется перспективным в плане построения систем авто- 
матического понимания речи — моделей естественного восприятия 
речи человеком [13, 36]. 


5.4. СЛУХОВАЯ СПЕКТРОГРАФИЯ РЕЧЕВЫХ СИГНАЛОВ 


Динамическая спектрография речи развивалась в основном 
в сторону выявления в спектре все большего количества деталей, 
увеличения чувствительности и динамического диапазона частот- 
но-временных характеристик речевого сигнала. За время 35-летней 
эволюции приборов «видимой речи» их основные структурные схе- 
мы принципиально не менялись. В них по-прежнему используются 
полосовые фильтры с фиксированной шириной полосы. Если ос- 
новной интерес исследователя сосредоточен на спектральных осо- 
бенностях речевого сигнала, он может пользоваться набором узко- 
полосных фильтров шириной 45 Гц, если же он заинтересован 
в изучении временных подробностей сигнала, в его распоряжении 
имеются широкополосные фильтры шириной 300 Гц. Практикуется 
подъем высоких частот, начиная, как правило, с частоты 1 кГц, 
который может иметь разную крутизну, от 6 до 18 и более дБ на 
октаву. Этим компенсируется падение интенсивности гармоник 
в спектре источника голосового сигнала, крутизна которого в сто- 
рону высоких частот составляет около 12 дБ на октаву. При 
помощи указанных приемов на динамических спектрограммах 
типа «видимой речи», называемых обычно сонограммами, удается 
визуализировать множество спектрально-временных деталей. Од- 
новременно с этим для увеличения адекватности динамических 
спектрограмм «видимой речи» и слухового описания речевого си- 
гнала имеется ряд неиспользованных резервов, и в направлении 
их реализации движется исследовательская и конструкторская 
мысль. Одна из плодотворных попыток в этом отношении осу- 
ществлена в Институте физиологии им. И. П. Павлова, где была 
разработана модель спектрального слухового анализа [2, 18, 19, 
35}. 

Структура модели основывается на биофизических представле- 
ниях о гидродинамике улитки внутреннего уха, а ее частотные 
характеристики аппроксимируют данные, известные на основании 
психоакустических и нейрофизиологических экспериментов. Мо- 
дель воспроизводит только линейные явления слуховой периферии. 

Модель выполнена в виде аналогового устройства, в которое 
входят следующие принципиальные блоки. Первый блок коррек- 
тирует входной сигнал согласно частотной характеристике сред- 
него уха и базальной части улитки. Далее следует 128 низко- 
частотных фильтров второго порядка с малыми значениями 
добротности и понижающейся с возрастанием номера фильтра 
(«координаты») резонансной частотой. Они включены последова- 
тельно и развязаны буферными усилителями. Их частотные ха- 
рактеристики умножаются, в результате чего формируются харак- 
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теристики с очень крутым склоном в сторону высоких частот. 
Предварительное формирование таких характеристик обеспечива- 
ется первыми 8 блоками. Последующие 120 блоков образуют 
«длинную линию», воспроизводящую прохождение волны вдоль 
улитки. На начальные звенья «длинной линии» приходятся высо- 
кие частоты, на конечные — низкие. На выходе каждого из ука- 
занных звеньев подключены дополнительные активные низкоча- 
стотные фильтры второго порядка с более высокой добротностью. 
Они обеспечивают дополнительное «обострение» частотных ха- 
рактеристик и приближение их ширины к критическим полоскам 
слуха. Выходной сигнал каждого из фильтров представляет коле- 
бания определенной области основной мембраны вдоль по оси 
улитки. 

Как указывают авторы [18, 19, 20], вид слуховых спектрограмм 
определяется частотно-координатными свойствами модели. Сред- 
ние частоты ее 120 каналов лежат в диапазоне от 30 до 9500 Гц. 
В области до 800 Гц ширина полос фильтров постоянна, связь 
между номером координаты и частотой фильтра линейна. В об- 
ласти выше 800 Гц постоянной сохраняется относительная ширина 
полос фильтров, связь между номером координаты и частотой 
фильтра — логарифмическая. Скорость реакции зависит от харак- 
теристической частоты координаты: время задержки ответа на 
импульсное возбуждение имеет порядок 0,25 мс для частоты 
7000 Гц, 2 мс для 1000 Гц, 5 мс для 250 Гц. Разделение «длинной 
линии» на три цепочки дало возможность сократить время за- 
держки импульсного ответа модели и приблизить его к наблюдае- 
мому для соответствующих частотных координат улитки внутрен- 
него уха. 

Для снятия динамических спектрограмм, которые были назва- 
ны слуховыми спектрограммами, анализируемый сигнал. много- 
кратно повторяется с помощью специального магнитофона с вра- 
щающейся головкой и подается на вход модели. Электронный 
коммутатор с каждым новым оборотом головки последовательно 
подключает к регистратору по одному из выходов модели. Син- 
хронно с каждым оборотом магнитной головки смещается на одну 
строчку оптическая головка записи на фотобумагу. Сигналы с вы- 
ходов модели после логарифмирования и детектирования исполь- 
зуются для модуляции яркости неоновой лампы оптической голов- 
ки записи. В результате на фотобумаге регистрируется изображе- 
ние слуховой спектрограммы речевого сигнала с осями — время, 
частота, интенсивность аналогично как и в случае сонограмм. 

На слуховых спектрограммах речевых сигналов четко выделя- 
ются участки гласных звуков. Сравнение сонограмм и слуховых 
спектрограмм показывает ряд интересных особенностей послед- 
них. Так, на сонограммах, снятие которых производится фильтра- 
ми с шириной полосы 300 Гц, хорошо выделяются Форманты, 
лежащие в области средних частот 800—2000 Гц. Более высоко- 
частотные максимумы проявляются здесь с чересчур большой 
детализацией, не свойственной слуху в этой частотной области. 


147 


В то же время изображение низкочастотных спектральных со- 
ставляющих оказывается «смазанным», и в области частот ниже 
600 Гц на спектре гласных часто наблюдается расплывчатая тем- 
ная полоса с трудно разделимыми формантными максимумами 
и полосой основного тона. 

Слуховые спектры в этом отношении проявляют то преиму- 
щество, что в них визуализируется та часть низкочастотного 
спектра, которая в действительности выделяется слуховым ре- 
цептором. Это первая и вторая форманты гласных. Поэтому 
сравнительная бедность слуховых спектрограмм гласных по свое- 
му составу по сравнению с сонограммами не является их недо- 
статком, а лучше, чем у последних, скоррелирована с событиями, 
осуществляющимися на основной мембране внутреннего уха. 
Сглаженность деталей слуховых спектрограмм в высокочастотной 
области подтверждается рядом электрофизиологических данных. 

В сонограммах отражение гармонической структуры в полосе 
основного тона часто мешает выделению первой форманты, в то 
время как на слуховых спектрограммах гармоническая структура, 
связанная с основным тоном, выражена слабее, а факт работы 
голосовых связок прослеживается по характерным колебаниям 
в низкочастотном диапазоне и по вертикальной полосатости в вы- 
сокочастотной области. Это оказывается существенным для лока- 
лизации гласных и сонорных согласных. Хорошо выделяется на 
слуховых спектрограммах информация о шумах щелевых соглас- 
ных, а также о быстропротекающих процессах, таких как взрыв- 
ные сегменты взрывных согласных. 

Существенным при регистрации слуховых спектраграмм фак- 
тором является более высокая, чем у сонограмм, скоррелирован- 
ность полос анализа с критическими полосками слуха — они узки 
в низкочастотной области и расширяются к высоким частотам. 
Это позволяет обойтись без подьема высоких частот при реги- 
страции слухового спектра, а следовательно, уменьшить несоот- 
ветствие технического и физиологического анализа динамических 
спектров речи. 

Разработчики модели спектрального анализа указывают, что 
в ответах модели сохраняется информация о быстро протекающих 
изменениях сигнала, которые способен воспринимать человек, 
а на спектральных изображениях сигналов, создаваемых моделью, 
могут быть выделены подробности, соответствующие минимально 
воспринимаемым спектральным максимумам [18, 19]. Это дает 
основание считать, что слуховые спектрограммы речевых сигналов 
отражают существенные характеристики речевых звуков. Читате- 
ля не должен смущать тот факт, что регистрируемые на фотобу- 
маге лабораторные образцы слуховых спектрограмм по качеству 
исполнения уступают сонограммам лучших фирм, претерпевшим 
многолетнюю техническую эволюцию. Адекватность получаемой 
на слуховых спектрограммах информации, несомненно, внесет свои 
коррективы в развитие техники динамической спектрографии речи 
в будущем. 
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Рис. 5.4.2. Слева направо: сонограммы 

слов [аб’йОм], [услОвна] — верхний ряд; 

[фОрму], [вл’Эва] — средний; [хОрда], 
[к’инО] — нижний. 


На рис. 5.4.2 приведены динамические спектрограммы (соно- 
граммы) слов «объем», «условно», «форму», «влево», «хорда», 
«кино», произнесенных диктором-мужчиной (Н. 3.). Слуховые 
спектрограммы тех же слов в том же порядке приведены на 
рис. 5.4.1. 

В слове «объем» обращают на себя внимание четко выражен- 
ные на слуховой спектрограмме первая и вторая форманты пред- 
ударного гласного [а] и ударного звукосочетания [йо], тогда как 
структура третьей и более высоких формант выражена заметно 
слабее, чем на сонограмме. Отчетливее, чем на сонограмме, выде- 
ляется структура носовых формант конечного [м]. 

На слуховой спектрограмме слова «условно» хорошо проявля- 
ется формантная структура гласных [у], [0] и [а], которые легко 
отличить от звонких согласных [л), [в], [н], благодаря более высо- 
кой разрешающей способности слуховой спектрограммы в низко- 
частотной области. Одновременно с этим щелевой согласный [с] 
зарегистрирован вполне отчетливо. 

Заметно проявляется на слуховой спектрограмме шум щеле- 
вого согласного [ф], который почти незаметен на сонограмме сло- 
ва «форму». Это обусловлено улучшенной характеристикой фильт- 
ров в анализаторе слухового спектрографа. Хорошо проявляются 
детали формантного строения гласных, четко вырисовывается но- 
совая форманта звука [м]. 

Сегментация слова «влево» на фонемные элементы не хуже 
прослеживается на слуховой спектрограмме, чем на сонограмме, 
Особенно выигрывает изображение начального звонкого соглас- 
ного [в]. Очень хорошо прослеживается динамика первой форман- 
ты на интервале гласных этого слова. 

На примере слова «хорда» можно убедиться, насколько лучше 
визуализируется на слуховых спектрограммах низкочастотный 
шум согласного [х]. В этом слове хорошо проявляются также де- 
тали формантного строения гласных, виден дрожащий характер 
согласного [р]. 

Выигрывают на слуховых спектрограммах изображения носо- 
вых согласных, в которых заметно направление движения фор- 
мант между окружающими гласными. Это можно проследить на 
примере слуховой спектрограммы слова «кино», если сопоставить 
ее с аналогичной сонограммой. Следует отметить, что коартикуля- 
ционные влияния звуков, проявляющиеся в изменении движения 
низкочастотных формант, видны на слуховых спектрограммах, 
как правило, с хорошей отчетливостью. 

На рис. 5.4.3 и 5.4.4 приведены в сопоставлении сонограммы 
и слуховые спектрограммы отдельных фраз. На рис. 5.4.3 в верх- 
нем ряду приведена сонограмма фразы «Наши ноги мокры». 
Читателю, привыкшему к расшифровке сонограмм по опыту, при- 
обретенному на материале предшествующих глав, без труда удаст- 
ся идентифицировать сперва глухой щелевой согласный (ш], затем 
звуковые реализации слогов [но], [мо], паузу и взрыв согласного 
[к], а рядом с ними станут’ ясными и спектрально-временные изо- 


152 


5-96 11 
= 


291 


о Мо ~ Оф 


Рис. 5.4.3. Слева направо динамиче- “. 


ские спектрограммы фраз [нАшънО- 

гимОкры], [ЙАнгрАйуспадрУгам‘и] — 

верхиий ряд; [фсеадУбЫл’игАлк’ива- 

рОны]--нижиий, сиятые при помощи 
соиографа. 


0 | 
0 04 02 03 04 05 08 07 08 09 10 14 42 43 14 1.5 165 






анаа 


бражения других звуков. На рис. 5.4.4 тоже в верхнем ряду 
приведена слуховая спектрограмма той же фразы. 

Фонемная идентификация слуховой спектрограммы потребует 
от читателя большего внимания и напряжения вследствие отсут- 
ствия навыка их визуального анализа. Тем не менее нам удастся 
отметить ряд существенных деталей, которые невидимы на соно- 
грамме, а проявляются на слуховой спектрограмме и помогают 
в расшифрфвке фразы. Это в первую очередь свидетельство не- 
прекращающейся вокализации во время звонкой смычки соглас- 
ного [г] и следующего за ним гласного [и], в то время как на 
сонограмме полоса основного тона резко ослаблена на указанном 
интервале и может послужить причиной ошибки. Хорошо видна 
формантная структура гласных и носовых согласных, а также 
и других звуковых элементов фразы. 

В нижнем ряду на рис. 5.4.3 и 5.4.4 приведены сонограмма 
и слуховая спектрограмма фразы «В саду были галки и вороны». 
Сравнивая оба способа регистрации динамических спектрограмм 
этой фразы, можно отметить, что на слуховой спектрограмме луч- 
ше удается уточнить начало работы голосовых связок в звуко- 
сочетании [кии], а также четче зарегистрирован шум начального 
глухого щелевого согласного [Ф]. В обоих случаях зарегистриро- 
ван интересный факт постепенного оглушения сонорного соглас- 
ного [л’] перед глухим согласным [к]. Конец звука [л’] легко лока- 
лизовать по наличию своеобразного среднечастотного «щелчка», 
соответствующего моменту отхождения языка от неба. Хорошо 
заметно уже на сонограмме, а слуховая спектрограмма не остав- 
ляет в этом сомнения, что конечная часть согласного [л’] оглу- 
шена и произносится как бы в шепотном варианте, что объясня- 
ется влиянием последующего глухого [к]. Факты оглушения сонор- 
ных гласных далеко не всегда удается зарегистрировать так 
четко, как это имеет место в приведенном выше случае. Одно- 
временно с этим ни сонограмма, ни слуховая спектрограмма при- 
веденной фразы не несет в себе достаточных сведений для того, 
чтобы уверенно идентифицировать в ней все звуковые реализации 
фонем, не прибегая к контекстуальной информации. 

В верхнем ряду справа на рис. 5.4.3 и посредине на рис. 5.4.4 
соответственно сонограмма и слуховая спектрограмма фразы 
«Я играю с подругами». Бросается в глаза предельная редуци- 
рованность звука [у] в звукосочетании [йу], которая выступает 
в безударном положении и одинаково хорошо видна в обоих 
случаях регистрации динамической спектрограммы. Используя 
контекстуальную информацию и накопленный опыт чтения спектро- 
грамм, не трудно локализовать и фонемно идентифицировать со- 
ответствующие звуковые реализации фонем этой фразы. 

Несомненно, лабораторные образцы слуховых спектрограмм 
в настоящее время не могут конкурировать по’ качеству изобра- 
жения с сонограммами, выполненными на аппаратуре «види- 
мой речи» лучших коммерческих фирм. Тем не менее принципы 
анализа, осуществленные в моделях слухового анализатора, по- 
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Рис. 5.4.4. Динамические спектрограммы тех же самых фраз, 
которые были приведены на предыдущем рисунке, снятые при 
помощи слухового спектрометра. Объяснения в тексте. 
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зволяют считать это направление в усовершенствовании метода 
динамической спектрографии перспективным. Он продолжает раз- 
виваться в направлении отображения при анализе других фено- 
менов слуховой рецепции, таких как, например, двухтоновое по- 
давление и др. [18, 19]. 


5.5. ПРАКТИЧЕСКИЕ ПРИМЕНЕНИЯ МЕТОДА 
ДИНАМИЧЕСКОЙ СПЕКТРОГРАФИИ РЕЧИ 


Методы визуального изучения спектральной динамики речи 
позволили сформулировать и обосновать возможность решения 
двух важных задач, представляющих научный интерес и имеющих 
большое поле практического применения. Это задачи автомати- 
ческого распознавания и синтеза речи. [5, 11, 15, 21, 25, 26, 31, 
39, 41]. 

Нельзя представить себе прогресс в области автоматического 
распознавания речи вне связи с накоплением опыта в сфере 
«чтения» динамических спектрограмм. Невозможно приступать 
с научно обоснованных позиций к построению схем автоматиче- 
ского распознавания и понимания речи, не отдавая себе отчета 
в разнообразии звуковых реализаций фонем русского языка, в за- 
кономерностях нх взаимодействий, в противоречивости спектраль- 
но-временных характеристик осмысленных речевых высказываний. 
Слушая и воспринимая звуковое многообразие родной речи, ауди- 
тор, надо полагать, весьма близок в своем принципиальном ана- 
литическом поведении к оператору, осуществляющему процесс 
визуального «чтения» динамических спектрограмм. Несомненно, 
в том и другом случае его поведение базируется на текущей клас- 
сификации акустических явлений, в процессе которой используется 
информация об анатомо-физиологических особенностях образова- 
ния звуков речи, о тех функциях, которые последние осуществля- 
ют в системе языка. Важнейшая из этих функций состоит в том, 
чтобы образовывать различаемые звуковые оболочки значимых 
языковых единиц, к которым относятся морфемы и слова. Меха- 
низмы такого рода классификации звуков речи вырабатываются 
у человека в практике языкового общения. В их основе лежит 
фонемный анализ сигналов речи. Несомненно, звуки реальной ре- 
чи в динамическом речевом потоке постоянно подлежат фонемной 
категоризации, если только речь воспринимается как осмысленное 
явление, т.е. происходит ее понимание. Из этого не следует, 
однако, что языковая интерпретация речи требует, чтобы она ре- 
ально воспринималась как последовательность всех минимальных 
смыслоразличительных единиц. 

Для практического использования фонетических знаний в по- 
строении систем автоматического распознавания и понимания речи 
не менее важно подчеркнуть другое обстоятельство, а именно то, 
что смыслоразличительная функция единичных звуков речи осу- 
ществляется в естественной речи далеко не повсеместно, более 
того,— довольно редко. Роль отдельных звуков в разделении по 
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смыслу разных слов весьма различна и отнюдь не постоянна. Она 
определяется контекстом, структурой языка и правилами разго- 
ворной речи, прагматиком, определяющей тему разговора. Непре- 
рывно меняется вместе с используемым словарным запасом, ак- 
тивно вовлекаемым в речевой процесс в данный момент времени, 
и смыслоразличительная функция отдельных звуков речевого 
потока. В силу этого классификация речевого потока на фонемные 
категории осуществляется в восприятии далеко не по формаль- 
ным схемам таксономического отнесения к тому или иному фонем- 
ному классу. Этот процесс неотъемлемо связан с канвой языково- 
го мышления, непрерывных предсказаний и их направленных 
проверок. Мы имели возможность убедиться в этом на материале 
динамических спектрограмм слитных фраз. 

Огромная сложность естественного процесса восприятия зву- 
ковой речи человеком преодолевается и обеспечивается посред- 
ством работы мозгового аппарата, мощность которого не идет ни 
в какое сравнение с возможностями применяемых для распозна- 
вания речи современных электронно-вычислительных машин. Тем 
не менее опыт построения систем автоматического распознавания 
и понимания речи, накопленный за последние десятилетия, недву- 
смысленно показывает, что структура перспективной системы рас- 
познавания речи неизбежно должна отображать собой, в том или 
ином приближении, модель восприятия речи человеком. Первым 
этапом в построении такого рода модели так или иначе должно 
выступать накопление знаний о спектрально-временной динамике 
звуковой речи в реальном речевом потоке осмысленно артикули- 
руемых высказываний. 

Вторая важная сфера применения метода динамической 
спектрографии находится в области решения проблемы синтеза 
речи. Эта многообещающая проблема богата практическими при- 
ложениями. Одновременно с этим синтез речи является важней- 
шим средством проверки значимости для восприятия тех спект- 
рально-временных ключевых признаков звуков речи, которые, 
являясь акустическими коррелятами воспринимаемых слухом ха- 
рактеристик способа, места и источника образования речевого 
сигнала, визуализируются на динамических спектрограммах речи. 

Принцип синтеза речи показан на рис. 5.5.1, где приведена 
блок-схема синтезатора ОМЕ — ПІ, разработанного в лаборатории 
речевой коммуникации Королевского технологического института 
в Стокгольме [43] Синтезатор ОУЕ— Ш состоит из трех отдель- 
ных параллельных ветвей, соединенных общим выводом. Первая— 
ветвь Ё — служит для задания акустических коррелятов конфи- 
гурации полости рта и определяется формантными частотами Р/, 
Е2, ЕЗ и Р4 с соответствующими ширинами полос. Ширина поло- 
сы, а также соответствующие постоянные времени сглаживающих 
фильтров не контролируются в ходе непосредственного синтеза, 
а задаются предварительно. Формантная ветвь Ё может быть свя- 
зана с источником голоса ИГ или шума ИШ, или с тем и другим 
одновременно. В первом случае уровень звука регулируется бло- 
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Рис. 5.5.1. Функциональная схема синтезатора речи 
ОМЕ — 3 [43]. Объяснение в тексте. 


ком управления амплитудой источника голоса АО. Это имеет мес- 
то, например, при синтезе гласных. В том случае, когда ветвь Р 
соединяется с источником шума, его уровень регулируется блоком 
управления амплитудой аспиративного шума АН в режиме обра- 
зования придыхательных звуков (места управления показаны 
широкими стрелками). Вторая, фрикативная ветвь, охватывающая 
два резонанса КІ и К? и один антирезонанс КО, предназначена 
для формирования спектра сегментов фрикативного шума. Его 
интенсивность регулируется блоком управления уровня фрикатив- 
ного шума АС. Третья, назальная, ветвь используется для задания 
назального резонанса ЕМ и предназначена, главным образом, для 
воспроизведения назальных согласных или назализованных глас- 
ных, а блок АМ предназначен для управления уровнем назальной 
ветви системы. 

Указанная организация управляемых параметров хорошо со- 
гласуется с развиваемой Г. Фантом акустической теорией специ- 
фикации сегментов согласно их фонетической природе, отражаю- 
щей их образование [29]. Следует подчеркнуть, что здесь относи- 
тельные уровни формант не контролируются независимо, а функ- 
ционально вытекают из частотного расположения задаваемых 
формант. 

Идея фонемного синтеза состоит в том, чтобы обеспечить 
слитную разборчивую речь, задаваемую пофонемно печатанием 
последовательности буквенных символов с пульта управления, 
независимо от взаимосочетаний фонем в различных текстах. По- 
скольку синтезируемое сообщение задается как последователь- 
ность фонем, исходная и принципиально важная часть работ по 
синтезу заключается в формировании в памяти машины библио- 
теки фонем. Каждый фонемный образец в библиотеке фонем пред- 
ставляет собой набор управляемых параметров, которые задаются 
ступенчато с соответствующими временными индексами и указа- 
нием абсолютной длительности для каждого из них. При состав- 
лении сочетаний фонем эти параметры стыкуются, сохраняя по- 
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следовательность их поступления во времени, а соответствующие 
фильтры сглаживают задаваемые ступенчатые изменения, обеспе- 
чивая плавность акустического выхода и сохраняя специфику 
переходных процессов. Процедура ступенчатого управления син- 
тезом речи исходит из концепции инерционности речедвигательно- 
го аппарата, управляемого дискретными импульсными командами 
нервной системы. 

Современная техника синтеза речи позволяет осуществить 
синтез любых высказываний по правилам, учитывающим, как соб- 
ственные характеристики звуков речи, так и закономерности их 
взаимного влияния друг на друга на оси времени. Эти правила, 
закладываемые в памяти компьютера, управляющего синтезато- 
ром, предварительно тщательно изучаются для каждого языка 
посредством сопоставления динамических спектрограмм образцов 
естественной и синтезированной речи. 

В настоящее время качество синтезированной речи, созда- 
ваемой лабораторными и промышленными синтезаторами, дости- 
гает высокого уровня. На рис. 5.5.2 приведен прнмер динамической 
спектрограммы фразы «Девушка, как тебя зовут?», синтезирован- 
ной при помощи синтезатора ОУЕ—ПТ. На ней отражены в не- 
сколько подчеркнутом виде основные спектрально-временные клю- 
чи составляющих ее звуков и специфика их взаимной коартику- 
ляции [12, 45]. 

Как метод оценки значимости признаков, несущих фонетичес- 
кую информацию об источнике, месте и способе образования зву- 
ков речи в последовательностях, составляющих целостные сообще- 
ния, синтез речи дает важные аргументы о роли этих признаков 
в механизмах восприятия речи человеком. 


* * 
* 


На этом мы заканчиваем рассмотрение динамических спектро- 
грамм речевых сигналов с тем убеждением, что они заслуживают 
дальнейшего, более углубленного изучения специалистов — фоне- 
тистов, физиологов, биофизиков, психологов, инженеров и акусти- 
ков, занимающихся конкретными речевыми проблемами. Мы 
надеемся, что опыт, приобретенный читателем в процессе чтения 
книги, позволил ему ощутить богатство естественной звуковой речи 
и своеобразие ее акустической реализации как средства общения. 

Закономерности отображения в динамической спектрограмме 
наиболее значимых фонетических явлений, связанных с характером 
управления речедвигательным аппаратом, а следовательно, с осо- 
бенностями произношения отдельных звуков речи и их взаимного 
влияния в речевом потоке, несомненно представляют значительный 
теоретический и практический интерес. Динамика спектральных 
характеристик речевых сигналов является основой для изучения 
восприятия принципиально важных акустических явлений, которые 
позволяют слуховой системе человека распознавать и понимать 
человеческую речь. Именно на базе изучения спектрально-времен- 
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ных характеристик речи и их автоматической обработки представ- 
ляется дальнейший прогресс в создании систем распознавания и 
понимания речи в ЭВМ, автоматах и роботах, а также в создании 
электронных синтезаторов естественной речи. В частности, для 
специалистов в области анализа, синтеза и автоматического рас- 
познавания речи весьма важно иметь визуальные представления 
о том, как далеко могут зайти изменения отдельных элементов 
речи, не вызывая принципиальных трудностей в восприятии речи 
как таковой. Ознакомление с динамическими спектрограммами 
звуков, слов и фраз естественной и синтезированной речи пред- 
ставляет в этом плане особый интерес. 

В заключение можно с уверенностью утверждать, что метод 
динамической спектрографии речи, будучи столь многообещающим 
в своих теоретических аспектах и практических применениях для 
гуманитарных, естественных и технических наук, совершенствуясь 
в воспроизведении все большего объема биофизических деталей 
рецепции акустической речевой волны, надолго сохранит свое фун- 
даментальное значение в исследовании принципов и механизмов 
речевой коммуникации. 


Приложение 


Список слов, динамические спектрограммы которых 
приводятся в книге. 


Слово 


бабочка 
бабушка 
белка 

ваза 

ветка 
веществеиный 


вижу 
влево 
винз 
ворбны 
всех 
галка 
галкн 
гамма 
Геннадий 
горка 
гусенок 
Даша 
Двадцать 
девочка 
дети 
Дима 
Дмитрий 
дорога 
дубльвэ 
дымно 
ела 
ежик 
елки 
ершик 
жаба 
жили 
Зина 
Зоя 
Иван 
Илюша 
Ира 
каппа 
Катюша 
каша 
кино 


* Приводится вариант по так иазываемой нкающей норме. 
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В таблице дается фонемная транскрипция слов 
с использоваиием прииципов лениииградской 


фоиологической школы [4]. 


Фонемная 
транскрнпиня* 


бАбачка 
бАбушка 
б’Элка 
вАза 
в’Этка 
в’ишчЭств’ии- 
НЫЙ 
вИжу 
вл' Ева 
ви’Ис 
варОны 
фс'Эх 
гАлка 
гАлк'и 
гАмма 
г’иниАд’ий 
гОрка 
гус’Онак 
дАша 
двАццат” 





БР РА ЈИ РРА 


ме бо о оо Ко Ко Ко Ко Ко Бо сло бо Ко бо о № бо о № бо сло Срб Сл осло блр лоо 


1 бре бл М фа р м 0. Мо ба о Ко бо мн Со бо Со Ко Ко бо мн о Ко о До о лево нь 


Номер 
рис. 


Слово 


коза 
коиь 
кости 
котенок 
кофта 
кошка 
курица 
лампа 
ландыши 
лапка 
лещи 
лицо 
лужайка 
лямбда 
майка 
мама 
меньше 
Михаил 
Миша 
можио 
мышка 
мягкий 
начало 
иегде 
нес 
Николай 
нобла 
нос 
обљем 
осы 
ось 
очаг 
очи 
папа 
пели 
после 
пятьдесят 
рисую 
Рита 
роза 
розы 
Рома 





Фонемная 
траискрнлиия* 


казА 
кОи’ 
кОсти 
кат’Онак 
кОфта 
кОшка 
кУр’ица 
лАмпа 
лАидышы 
лАпка 
лишчИ 
л’ицО 
лужАйка 
л’Амбда 
мАйка 
мАма 
м’Эн’шэ 
м’ихаИл 
м'Иша 
мОжиа 





Номер 
рис 
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ць бо Ко бо Ко б бо бл бл 
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а раб рибама и 1 
Ме о ммр 5 Со С Ко бо Суб бл С) бо А о бо сло 


+ 
№" 


Л 
№ 
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Слово 


сам 
Саша 
седьмого 
сел 
синица 
сито 
собака 
собствеиный 
соловьи 
стой 
сын 
съел 
твердый 
телефон 
тетя 
тридцать 
туфли 
угольки 
ус 
условио 
учить 
учу 
фабрика 
Федор 
фигура 
филин 





Фонемная 
транскрипция 


сОпств’иниый 
салав НИ 
стОй 

сЫи 

сйЭл 
тв’Ордый 
тилифОн 
т’От’а 
тр'Иццат' 


услОвиа 
учИт' 
учУ 
фАбр’ика 
ф'Одар 
ф'игУра 
ф’Илии 


Номер 
рис. 
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с Фонемная Номер 
лово транскрипция рис. 
фоитан фантАи 428 
форма фОрма 4.49 
форму ФОрму 5.4.1 
фуражка фурАшка 4.5.1 
хата хАта 4.2.9 
хорда хОрда 5.4.1 
хороша харашА 4.3.2 
цех цЭх 4.2.4 
чай чАЙ 4.2.1 
час чАс 4.2.1 
чехи чЭх’и 4.2.9 
что што 4.6.1 
шаг шАк 4.5.2 
шалаш шалАш 4.2.10 
шар шАр 4.5.2 
шары шары 4.2.4 
шестьдесят шэз’д’ис’Ат 4.5.6 
Шура шУра 4.2.10 
щука шчУка 4.2.10 
электроприбор |ил’Эктрапр’и- 4.4.3 
бор 4.5.9 
этаж этАш 
Юра йУра 42.12 
ягоды йАгады 4912 
Яков йАкаф 452 
ямы йАмы 45.12 
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